基于大模型生成文献综述的实现思路：兼看昨日大模型进展早报

ai大模型应用开发

已于 2024-08-14 18:46:58 修改

阅读量2.3k

点赞数 9

文章标签：数据库 java 人工智能深度学习 llama 自然语言处理机器学习

于 2024-08-01 16:22:50 首次发布

本文链接：https://blog.csdn.net/2401_85375298/article/details/140851009

版权

今天是24年8月份的第一天，我们先来回顾下昨日大模型进展早报。

我们来看看一个工作，基于大模型的自动综述生成，Automated Review Generation Method Based on Large Language Models：(https://arxiv.org/pdf/2407.20906)，里面的思路可以看看。

一、基于大模型的文献综述生成方案的幻觉控制

Automated Review Generation Method Based on Large Language Models：(https://arxiv.org/pdf/2407.20906)这个工作，介绍了一种基于大模型的自动化文献综述生成方法，基于大模型来处理和整合科学文献。

先看结果：

在对丙烷脱氢（PDH）催化剂的案例研究中，该方法从343篇文章中生成全面的综述，每个LLM账户平均几秒钟就能处理一篇文章。对1041篇文章的扩展分析提供了对催化剂组成、结构和性能的见解。考虑到LLMs的幻觉问题，采用了多层次的质量控制策略。

多级过滤和验证的质量控制策略，类似于检索增强生成（RAG）的概念，以减轻并纠正幻觉：

文本格式过滤：注意到幻觉经常破坏文本格式，应用预定义的XML格式模板来过滤出格式混乱的文本。
DOI验证：DOIs（数字对象标识符）是一系列符号和数字的组合，它们与上下文没有直接的语义联系，这在生成中构成挑战，并容易出现幻觉。然而，DOIs精确的参考性质允许进行验证。通过对生成内容进行严格的DOI验证，抑制了幻觉内容的进一步传播，确保每个生成的结论都可以追溯到其原始来源。
相关性验证：在RAG系统中，语义相关但缺乏正确答案的文档尤其有害。在知识提取阶段仔细审查每个响应，确保其相关性，用相关关键词排除了离题的答案。
自我一致性验证：对于文本总结，存在一个确定的正确答案，认识到幻觉的随机性意味着正确的答案应该在迭代中更频繁地出现，我们采用从重复查询中聚合的方法来有效抑制幻觉。
全数据流可追溯性机制：通过使用DOIs作为每段生成内容的关键参考标识符，并强制每个结论都有引用，使综述读者能够轻松地追溯到原始文献，支持验证和对感兴趣的主题进行更深入的探索。

二、基于大模型的文献综述生成方案具体步骤

构建综述文章的方法由四部分组成：文献搜索、主题制定、知识提取和综述撰写，以及为有经验的用户提供的额外的数据挖掘模块。

其中：

1、文献搜索

最初，从期刊分类表中获取一组指定综述主题领域的期刊列表。然后，通过搜索引擎的API检索这些选定期刊中包含特定关键词的文献。接着进行初步筛选，检查每个标题和摘要是否有与选定关键词列表的交集。有交集的文献被保存，并且那些是综述性质的文献被标记。

该方法支持包括期刊、专利、会议论文、书籍等在内的各种类型的文本文献。这意味着任何文本形式的内容都可以被包括在搜索范围内，进一步扩展了方法的应用场景和覆盖面。

例如，使用 “propane dehydrogenation” 作为关键词，通过Google Scholar上的SerpAPI检索了343篇顶级化学和化学工程期刊的出版物（根据2022年中国科学院分类），在通过关键词如 “propane dehydrogenation”、“PDH”、“ODH”、“Oxidative Dehydrogenation” 等过滤标题和摘要后，包括14篇综述。

2、主题制定

构建综述主题有两种方法：一种是LLM直接起草大纲，另一种是基于LLM从现有文献综述中提炼和起草大纲。获得主题列表后，可以手动添加和排序额外的主题。

例如，Claude2模型直接生成了一个包括12个主题的大纲，另一个基于现有综述文章生成了9个主题和35个引导问题。

3、知识提取

根据获得的主题列表，LLM为从文献中提取信息生成一系列问题，每个综述主题对应一个问题。对于每篇文章重复这个过程多次后，所有答案都被连接起来。然后LLM确定答案是否与问题相关，并将它们聚合起来（见图3 (iii)）。

例如，在PDH案例中，将35个引导问题转化为从文献中提取信息的问题后，使用Claude2模型从343篇顶级文章中提取信息五次，将8575个响应聚合成2783个有效的信息组合。

4、综述撰写

将每篇文章的答案与其来源DOI关联起来后，为每个主题生成并整合段落。LLM从所有组合的答案中生成综述段落，然后进行总结和展望。多次重复这个过程后，LLM对生成的段落进行评分，为每个主题选择最佳段落，形成全文的初步草稿。

然后，在LLM的帮助下润色全文，调整和检查引用格式，以产生最终草稿。

例如，将各个文章的答案组合成JSON格式的信息组，输入到Claude2模型中进行段落生成，整合形成流畅的段落，重复9次，根据标准（如SI所示）由Claude2模型评分，并润色以产生最终草稿。

总结

本文主要看了基于大模型的文献综述生成方案，这其实很多学术领域的场景中会用到。

感兴趣的可以多看看。

那么，如何系统的去学习大模型LLM？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

所有资料 ⚡️ ，朋友们如果有需要全套《LLM大模型入门+进阶学习资源包》，扫码获取~
在这里插入图片描述

篇幅有限，部分资料如下：

👉LLM大模型学习指南+路线汇总👈

💥大模型入门要点，扫盲必看！
在这里插入图片描述
💥既然要系统的学习大模型，那么学习路线是必不可少的，这份路线能帮助你快速梳理知识，形成自己的体系。

👉大模型入门实战训练👈

💥光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。
在这里插入图片描述

👉国内企业大模型落地应用案例👈

💥《中国大模型落地应用案例集》 收录了52个优秀的大模型落地应用案例，这些案例覆盖了金融、医疗、教育、交通、制造等众多领域，无论是对于大模型技术的研究者，还是对于希望了解大模型技术在实际业务中如何应用的业内人士，都具有很高的参考价值。 （文末领取）
在这里插入图片描述
💥《2024大模型行业应用十大典范案例集》 汇集了文化、医药、IT、钢铁、航空、企业服务等行业在大模型应用领域的典范案例。