Skip to content

智能整理

痛点

Zotero 用久了,文献库不可避免地变得混乱:重复导入的论文、没有 PDF 的空壳条目、找不到所属条目的孤立附件、下载失败的损坏PDF、质量很差的灰色文献......这些"垃圾数据"不仅占用空间,还严重影响文献管理效率和引用准确性。

手动清理几千条文献是一件令人崩溃的事情——你需要逐条检查,判断哪些是重复的、哪些附件是坏的。智能整理功能提供一套自动化的清理工具,帮你快速发现和处理这些问题。

工作原理

智能整理包含多个独立的清理模块,每个模块解决一类问题:

1. 重复文献检测

  • 基于 DOI、标题相似度、作者匹配等多维度判断
  • 标记出疑似重复的条目对
  • 展示两条记录的详细对比,方便你决定保留哪个
  • 支持一键合并(保留元数据更完整的那条)

2. 空壳条目清理

  • 找出没有 PDF 附件、也没有任何笔记的条目
  • 这些条目通常是导入失败或只保存了书签
  • 可以选择批量删除或尝试重新获取 PDF

3. 孤立附件清理

  • 找出不属于任何条目的独立附件文件
  • 通常是删除条目后遗留的 PDF 文件
  • 可以选择删除或尝试匹配到对应条目

4. 损坏附件检测

  • 检查 PDF 文件是否可以正常打开
  • 检测文件大小异常(0字节或过小)的附件
  • 标记损坏的文件,可以选择删除或重新下载

5. 低质量文献过滤

  • 根据来源期刊的影响因子、被引次数等指标筛选
  • 标记出可能是低质量来源的文献
  • 适合清理大批量导入后的文献库

6. 合并文件夹

  • 找出名称相似或内容重叠的分类文件夹
  • 支持将多个文件夹合并为一个
  • 合并时自动去重

7. 智能归类

  • 对未分类的文献自动推荐归属文件夹
  • 基于论文标题、关键词和现有文件夹结构进行匹配
  • 可以一键接受推荐或手动调整

整理建议

  • 建议先做"重复检测"和"空壳清理",这两项对库的质量影响最大
  • 定期运行(每月一次),保持文献库整洁
  • 整理前建议先备份 Zotero 数据库

使用方法

打开智能整理

  1. 在 Zotero 菜单栏选择 AI4Paper → 智能整理
  2. 或在侧边栏中选择 整理 选项卡

选择清理模块

整理界面列出了所有可用的清理模块:

  1. 勾选你想运行的模块
  2. 点击 开始扫描
  3. 扫描完成后,结果按模块分类展示

处理扫描结果

每个模块的扫描结果都提供操作选项:

  • 重复文献:查看对比 → 选择保留项 → 合并/删除
  • 空壳条目:逐条确认 → 批量删除
  • 孤立附件:查看文件信息 → 删除/重新关联
  • 损坏附件:查看错误详情 → 删除/重新下载
  • 低质量文献:查看筛选依据 → 保留/移除

整个文件夹整理

  1. 在左侧分类树中右键点击文件夹
  2. 选择 AI4Paper → 整理此文件夹
  3. 只扫描该文件夹下的条目

注意事项

  • 删除操作不可撤销(但 Zotero 有回收站,30天内可恢复)
  • 合并重复文献时,笔记和标签会合并到保留的条目上
  • 首次使用建议先小范围试用,确认效果后再全库扫描
  • 智能归类功能消耗 AI 配额,其他模块不消耗

清理优先级建议

如果你的文献库比较混乱,建议按以下顺序清理:

  1. 重复文献 → 影响最大,去重后库的规模可能减少 10-20%
  2. 损坏附件 → 这些文件占用空间但无法使用
  3. 空壳条目 → 没有实际内容的条目只会干扰检索
  4. 孤立附件 → 释放存储空间
  5. 智能归类 → 最后整理分类结构

常见问题

Q: 整理会删除我的文献吗?

不会自动删除。所有清理操作都需要你确认后才会执行。扫描只是发现问题,处理权在你手上。

Q: 重复检测的准确率如何?

基于 DOI 完全匹配的准确率接近 100%。基于标题相似度的匹配可能有误判,建议逐条确认。

Q: 整理需要联网吗?

大部分模块(重复检测、空壳清理、孤立附件、损坏检测)都在本地完成,不需要联网。智能归类和低质量过滤需要 AI 分析,需联网。

Q: 可以定时自动整理吗?

目前不支持定时整理,需要手动触发。未来版本可能会增加定期提醒功能。

让天下没有难读的 Paper,让天下没有难做的科研