大语言模型
文章平均质量分 77
大语言模型相关的算法、工程实现及优秀项目
深度学习机器
前大厂算法工程师,现小厂全栈开发。写写代码,记录开发之路。
公众号:深度学习机器
个人网站:https://dlmachine.top
Github: https://github.com/zishengwu
展开
-
Chunkr: 在线PDF文档解析与OCR工具
这部分属于(pdf-document-layout-analysis)的内容,可以移步查看具体模型的介绍和训练过程。1.1 机器学习模型基于LIGHTGBM算法,并且只需要使用CPU资源,因此对硬件要求不高,速度快,但是只能处理文字类型的PDF。1.2 VGT模型能处理图片PDF,同时把版面内容识别为11种类型如果对表格、图片、手写内容的识别精度有要求,则需要使用该模型。原创 2024-10-21 09:00:00 · 523 阅读 · 0 评论 -
一文梳理RAG(检索增强生成)的现状与挑战
大模型相较于过去的语言模型具备更加强大的能力,但在实际应用中,例如在准确性、知识更新速度和答案透明度方面,仍存在不少问题,比如典型的幻觉现象。因此,检索增强生成 (Retrieval-Augmented Generation, RAG) 被当作于大模型应用开发的一种新范式。RAG是指在利用大语言模型回答问题之前,先从外部知识库检索相关信息,然后再让模型根据这些信息进行总结归纳,这样便能确保模型不会胡说八道,并且回答的内容是有所依据的。原创 2024-09-07 21:30:00 · 1454 阅读 · 0 评论 -
大模型RAG应用开发之PDF解析工具对比
非扫描件无OCR要求直接使用即可,能正确保留双列布局的文本顺序,同时能提取表格和图片,而且表格是以List的格式保留。其余几个传统的PDF解析库倾向于对pdf进行编辑,比如添加水印,增加或者删除页面等。中文文档效果不好,而且还是通过API使用,但是每天有固定的免费额度,可以用于处理扫描件。deepdoc和MinerU是近期开源项目中比较强大的RAG解析工具。deepdoc优势点在于表格效果较好,亲测无边框的表格有大多数效果仍可圈可点,并且保留为html格式,因此允许合并单元格;MinerU。原创 2024-08-28 12:15:00 · 491 阅读 · 0 评论 -
Magic-PDF:端到端PDF文档解析神器 构建高质量RAG必备!
比较准确。从上面的图可以看出,无论是可编辑的PDF还是扫描版的PDF,都能非常好的区分出版面中不同类型的部分,而且最终的结果是以Markdown的格式保存的,可以很容易把不同章节、不同自然段按需进行切分。原创 2024-08-01 13:15:00 · 774 阅读 · 0 评论 -
RAG文档解析利器:Deepdoc
Deepdoc是RAG框架RAGFLOW中使用的文档解析工具。原创 2024-07-30 14:00:00 · 1249 阅读 · 0 评论 -
DB-GPT:LLM应用的集大成者
等,如本项目中提到的。原创 2024-07-22 21:21:00 · 538 阅读 · 0 评论 -
基于Sentence Transformer微调向量模型
sentence transformer库升级到了V3,其中对模型训练部分做了优化,使得模型训练和微调更加简单了原创 2024-07-08 12:45:00 · 1158 阅读 · 0 评论 -
热门开源Text2SQL框架
Chat2DB项目地址:https://github.com/chat2db/Chat2DB简介:Chat2DB是一个通用的SQL客户端和数据分析工具,能够辅助生成SQL,同时支持对话式的数据分析功能,提供了网页、客户端2种使用方式,它支持几乎所有流行的数据库,并且chat2DB还开源了7B的SQL模型。特性:SQL生成、智能报告、数据探索。架构: SQL Chat项目地址:https://github.com/sqlchat/sqlchat简介:SQL Chat 是一个基于聊天原创 2024-06-27 12:45:00 · 494 阅读 · 0 评论 -
开源RAG框架汇总
本文搜集了一些开源的基于LLM的RAG(Retrieval-Augmented Generation)框架原创 2024-05-11 12:45:00 · 4339 阅读 · 0 评论 -
【高级RAG技巧】使用二阶段检索器平衡检索的效率和精度
虽然目前二阶段方法用来提升RAG的性能表现越来越受到关注,但是具体来看,其中所含的技术都是早就有的内容。Cross-Encoder这种架构在当时显得比较鸡肋,只能用来比较句子的相似度,甚至无法输出向量,在大部分自然语言处理场景中都不受待见,谁能想到在如今又焕发生机了呢?原创 2024-04-26 13:15:00 · 875 阅读 · 0 评论 -
【高级RAG技巧】在大模型知识库问答中增强文档分割与表格提取
openparse这个库算是目前开源社区中比较优秀的文档分割处理库了,功能虽然全面,还是还有不少可以优化的地方,后续也会支持其他向量化模型,并且可以跟LlamaindexLangchain等框架无缝衔接,应该值得持续关注。原创 2024-04-19 12:30:00 · 2476 阅读 · 0 评论 -
向量数据库Chroma学习记录
Chroma是一款AI开源向量数据库,用于快速构建基于LLM的应用,支持Python和Javascript语言。具备轻量化、快速安装等特点,可与Langchain、LlamaIndex等知名LLM框架组合使用。原创 2024-04-13 18:00:00 · 1619 阅读 · 0 评论 -
零基础小白也行,只用一行命令在自己的电脑跑大模型
目前该项目更新非常快,从路线图看后期还会支持更多模型和功能。相比于研究更强大的模型,减少技术的使用门槛对于普通人来说,显得更有实际意义。原创 2024-03-12 18:00:00 · 2034 阅读 · 0 评论 -
llm构建数据标注助手
在LLM出现之前,传统的深度学习模型(包括CV和NLP)就已经需要大量的数据进行训练和微调。没有足够的数据,或者数据需要进行二次加工(比如标签标注),这些问题都成为限制深度学习模型泛化的关键。对于第一个问题,一般就是从网络上爬虫或者花大价钱从数据供应商购买数据;对于第二种情况,一般是找外包进行标注,这在业界非常普遍。原创 2024-03-10 09:52:29 · 1192 阅读 · 0 评论 -
Chat2table,简易表格分析助手
之前用智谱AI的Chatglm3-6b模型写过一个简单的论文阅读助手,可用来辅助论文阅读等。而像表格,如Excel、CSV文件等内容的分析,也是不可忽略的需要,因此本文同样使用Chatglm3-6b来搭建一个表格分析助手,用于快速分析表格的内容,提取有效的信息。ChatGLM3 采用了全新的对话格式,除最基本的对话外,还支持工具调用和代码执行。简单来说,代码执行属于工具调用的子类,只是提示词不一样,而这两种功能是通过修改微调阶段的提示词来实现的。原创 2024-02-29 12:00:00 · 896 阅读 · 0 评论 -
8k中英双语文本嵌入模型效果初探
向量模型用于生成向量表示,被广泛应用于检索、分类、聚类或语义匹配等传统的自然语言处理任务。到了大模型时代,由于上下文长度的限制,需要压缩、存储和查询大量的信息,这就需要用到向量模型对输入的文本进行向量化表示,然后再喂给大模型,以得到期望的输出。,例如处理数十页的报告综述等。原创 2024-02-25 10:10:18 · 500 阅读 · 0 评论 -
大语言模型常见的文本切分之语义嵌入
选择了一篇新闻稿,有比较明显的段落区分,每个段落由若干句子构成,可用于验证切分效果。原创 2024-01-24 12:00:00 · 543 阅读 · 0 评论 -
大语言模型常见的文本切分方式整理汇总
本文整理了一些简单的文本切分方式,适用于大语言模型经典应用RAG或相似场景。原创 2024-01-20 08:51:17 · 1171 阅读 · 0 评论 -
Stable Diffusion中的图像修改尺寸和编辑工具实现
在图生图中,使用Stablediffusion的pipeline来构建Webui应用,如果直接把参数传给pipeline是无效的。__call__参数中虽然有单独的weight和height这两个参数,但最终图像尺寸实际上是由传入图片的尺寸决定的,因此需要定义函数来做原始图片的尺寸变换,达到用参数来控制输出图像尺寸的目的,这可以通过resize调整图片尺寸大小来实现。上传一张初始图片图片宽度和高度按照比例调整,缩放到1.2倍,高度和高度同步变成1232。原创 2023-12-23 12:30:00 · 1339 阅读 · 0 评论 -
几行代码实现可视化的文生图采样过程
Huggingface的实现了端到端的文生图功能,用户输入文字,即可得到最后的图片。但是在某些场景下,如果需要获取中间过程的图片,用于优化长时间等待过程的用户体验,就只能通过修改源码进行实现了。原创 2023-12-21 12:00:00 · 493 阅读 · 0 评论 -
无需langchian,5分钟搭建专属论文阅读助手
langchain是一个非常热门的大模型应用开发框架,可以帮助我们快速开发基于大模型的下层应用。本文不打算使用langchain开发,而是用少量代码实现论文阅读助手这个功能。原创 2023-11-30 23:12:35 · 1039 阅读 · 0 评论 -
Stable Diffusion中的插件功能是怎么实现的
通过一个翻译插件项目,我了解到怎么在原始的的gradio项目中添加额外的插件功能,而无需进行太多改动。而且这些插件功能通过js可以实现各种额外的功能,大大弥补了gradio的弱点。原创 2023-11-21 23:31:11 · 159 阅读 · 0 评论
分享