使用本地大模型从论文PDF中提取结构化信息

Shy960418

已于 2024-09-12 21:27:05 修改

阅读量3k

点赞数 10

分类专栏：深度学习文章标签： pdf python llama RAG

于 2024-08-07 16:46:07 首次发布

本文链接：https://blog.csdn.net/m0_37134868/article/details/140995694

版权

1 安装ollama

点击前往网站 https://ollama.com/ ，下载ollama软件，支持win、Mac、linux

2 下载LLM

ollama软件目前支持多种大模型，如阿里的（qwen、qwen2）、meta的(llama3、llama3.1)，读者根据自己电脑配置下载相应的模型。
以llama3.1为例，根据自己电脑显存性能，选择适宜的版本。如果不知道选什么，那就试着安装，不合适不能用再删除即可。打开电脑命令行cmd(mac是terminal), 网络是连网状态，执行模型下载(安装)命令

ollama run llama3.1

3 安装python包

在python中调用ollama服务，需要ollama包。

打开电脑命令行cmd(mac是terminal), 网络是连网状态，执行安装命令

pip install ollama

4启动ollama服务

在Python中调用本地ollama服务，需要先启动本地ollama服务，打开电脑命令行cmd(mac是terminal), 执行

ollama serve

5 设计提示词

该提示存储在scientific_papers_prompt.txt 中

科学研究论文：
--- 
{
   document} 
---

您是分析科学研究论文的专家。 请仔细阅读上面提供的研究论文，并提取以下关键信息：

从研究论文中提取以下六 (6) 个属性：
- 论文标题：研究论文的全名
- 出版年份：论文发表的年份
- 作者：论文所有作者的全名
- 作者联系方式：字典列表，其中每个字典包含每个作者的以下键：