Zotero-arXiv-Daily:每日推荐您感兴趣的 arXiv 论文
项目介绍
Zotero-arXiv-Daily 是一个开源项目,旨在帮助科研人员跟踪他们感兴趣的最新科学研究成果。该项目通过分析用户 Zotero 文献库中的内容, daily 推荐与用户研究兴趣相关的 arXiv 论文,并通过电子邮件发送给用户。用户可以通过简单配置 GitHub Action 环境变量来实现每日自动化的论文推荐服务。
项目技术分析
Zotero-arXiv-Daily 的核心是一个自动化工作流程,该工作流程涉及以下技术环节:
- API 数据获取:通过 Zotero API 获取用户文献库中的数据,同时通过 arXiv API 获取最新的论文信息。
- 文本嵌入计算:使用文本嵌入模型(如 sentence-transformers)计算每篇论文摘要的嵌入向量。
- 相似度评分:根据用户文献库中的论文和最新 arXiv 论文的嵌入向量计算相似度评分,并按相关性排序。
- 生成 TL;DR:使用轻量级语言模型(如 Qwen2.5-3b-instruct-q4_k_m)为每篇论文生成简短的总结(TL;DR)。
- 邮件发送:通过配置 SMTP 服务器和邮件账户,将推荐论文的列表发送到用户指定的邮箱。
项目技术应用场景
Zotero-arXiv-Daily 可以在以下场景中发挥重要作用:
- 科研人员:帮助科研人员及时了解其领域内最新的研究进展。
- 学术团队:团队内部共享最新的相关研究论文,促进学术交流。
- 研究生与导师:研究生可以快速获取导师感兴趣的新论文,加强研究方向的一致性。
项目特点
Zotero-arXiv-Daily 拥有以下特点:
- 零成本部署:利用 GitHub Action Workflow 实现自动化部署,无需额外费用。
- 无需安装:用户无需在自己的电脑上安装任何软件,通过配置 GitHub 环境变量即可使用。
- 自动每日更新:每日自动获取并推荐最新的 arXiv 论文。
- 智能 TL;DR 生成:为每篇推荐论文生成简洁的总结,帮助用户快速筛选感兴趣的内容。
- 相关性排序:根据用户的 Zotero 文献库,对推荐论文进行相关性排序。
- 简单配置:通过简单的环境变量配置即可启动服务。
以下是详细的项目特点:
- 免费使用:所有计算都在 GitHub Action 的 runner 上进行,不会产生任何费用。
- TL;DR 智能生成:为每篇论文自动生成摘要,帮助用户节省阅读时间。
- 论文信息详尽:提供论文的 PDF 链接和代码实现链接(如有)。
- 快速部署:通过分叉仓库并设置环境变量即可快速部署。
- 支持 LLM API:可选使用云端 LLM API 生成 TL;DR。
- 自定义忽略规则:使用 gitignore 风格的模式忽略不感兴趣的 Zotero 论文。
Zotero-arXiv-Daily 项目的出现极大地方便了科研人员获取最新研究论文的过程,通过智能的推荐算法,用户可以更加高效地关注到对自己研究领域有价值的论文。其自动化、智能化的特点使其在学术圈具有广阔的应用前景。