![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
优质项目
文章平均质量分 78
深度学习机器
前大厂算法工程师,现小厂全栈开发。写写代码,记录开发之路。
公众号:深度学习机器
个人网站:https://dlmachine.top
Github: https://github.com/zishengwu
展开
-
DB-GPT:LLM应用的集大成者
等,如本项目中提到的。原创 2024-07-22 21:21:00 · 323 阅读 · 0 评论 -
热门开源Text2SQL框架
Chat2DB项目地址:https://github.com/chat2db/Chat2DB简介:Chat2DB是一个通用的SQL客户端和数据分析工具,能够辅助生成SQL,同时支持对话式的数据分析功能,提供了网页、客户端2种使用方式,它支持几乎所有流行的数据库,并且chat2DB还开源了7B的SQL模型。特性:SQL生成、智能报告、数据探索。架构: SQL Chat项目地址:https://github.com/sqlchat/sqlchat简介:SQL Chat 是一个基于聊天原创 2024-06-27 12:45:00 · 372 阅读 · 0 评论 -
记使用pdf.js过程遇到的坑
最近项目中需要用到js库来渲染pdf文件,调研后发现无论是reach-pdf.js或者是svelte-pdf.js都是在pdf.js基础上做了些许精简,反而功能还不如原始的pdf.js来得全面。但是原始的库几乎没有像样的代码示例,而能搜索到的大多数代码不少都是十几年前的了,在这个过程中踩了不少坑,做个记录,希望对看到的人有所帮助。原创 2024-05-16 13:00:00 · 535 阅读 · 0 评论 -
开源RAG框架汇总
本文搜集了一些开源的基于LLM的RAG(Retrieval-Augmented Generation)框架原创 2024-05-11 12:45:00 · 2739 阅读 · 0 评论 -
【高级RAG技巧】在大模型知识库问答中增强文档分割与表格提取
openparse这个库算是目前开源社区中比较优秀的文档分割处理库了,功能虽然全面,还是还有不少可以优化的地方,后续也会支持其他向量化模型,并且可以跟LlamaindexLangchain等框架无缝衔接,应该值得持续关注。原创 2024-04-19 12:30:00 · 1506 阅读 · 0 评论 -
向量数据库之Lancedb学习记录
Lancedb是一个用于人工智能的开源矢量数据库,旨在存储、管理、查询和检索大规模多模式数据的嵌入。Lancedb的核心是用Rust编写的,并构建在Lance之上,专为高性能 ML 工作负载和快速随机访问而设计。原创 2024-04-15 19:25:39 · 1947 阅读 · 0 评论 -
向量数据库Chroma学习记录
Chroma是一款AI开源向量数据库,用于快速构建基于LLM的应用,支持Python和Javascript语言。具备轻量化、快速安装等特点,可与Langchain、LlamaIndex等知名LLM框架组合使用。原创 2024-04-13 18:00:00 · 1191 阅读 · 0 评论 -
大白话扩散模型(无公式版)
虽然原始论文涉及到的知识包括随机分布,马尔科夫链等,而且推导过程极其复杂,但本文不会深入去推导相关的公式,而是把重心放在思考这个过程以及对其中发现的一些问题进行探讨。,因为一开始图片质量很高,加很小的噪声就发生很大的变化,而越后面的图片含有噪声越多,失真越严重,必须加更大的噪声才能引起较大变化。如果玩过文生图的话就能发现,选择了一定的采样步数后,前几步图片变化非常大,从模糊的噪声逐渐出现轮廓,后面几步基本不变,只是一些细节发生了变化。,然后我们用来进行训练一个模型,拟合训练数据的分布之后,就可以预测出。原创 2024-03-24 13:23:39 · 835 阅读 · 0 评论 -
零基础小白也行,只用一行命令在自己的电脑跑大模型
目前该项目更新非常快,从路线图看后期还会支持更多模型和功能。相比于研究更强大的模型,减少技术的使用门槛对于普通人来说,显得更有实际意义。原创 2024-03-12 18:00:00 · 1740 阅读 · 0 评论