自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 收藏
  • 关注

原创 热门开源Text2SQL框架

Chat2DB项目地址:https://github.com/chat2db/Chat2DB简介:Chat2DB是一个通用的SQL客户端和数据分析工具,能够辅助生成SQL,同时支持对话式的数据分析功能,提供了网页、客户端2种使用方式,它支持几乎所有流行的数据库,并且chat2DB还开源了7B的SQL模型。特性:SQL生成、智能报告、数据探索。架构: SQL Chat项目地址:https://github.com/sqlchat/sqlchat简介:SQL Chat 是一个基于聊天

2024-06-27 12:45:00 330

原创 记使用pdf.js过程遇到的坑

最近项目中需要用到js库来渲染pdf文件,调研后发现无论是reach-pdf.js或者是svelte-pdf.js都是在pdf.js基础上做了些许精简,反而功能还不如原始的pdf.js来得全面。但是原始的库几乎没有像样的代码示例,而能搜索到的大多数代码不少都是十几年前的了,在这个过程中踩了不少坑,做个记录,希望对看到的人有所帮助。

2024-05-16 13:00:00 373

原创 开源RAG框架汇总

本文搜集了一些开源的基于LLM的RAG(Retrieval-Augmented Generation)框架

2024-05-11 12:45:00 2181

原创 【高级RAG技巧】使用二阶段检索器平衡检索的效率和精度

虽然目前二阶段方法用来提升RAG的性能表现越来越受到关注,但是具体来看,其中所含的技术都是早就有的内容。Cross-Encoder这种架构在当时显得比较鸡肋,只能用来比较句子的相似度,甚至无法输出向量,在大部分自然语言处理场景中都不受待见,谁能想到在如今又焕发生机了呢?

2024-04-26 13:15:00 703

原创 【高级RAG技巧】在大模型知识库问答中增强文档分割与表格提取

openparse这个库算是目前开源社区中比较优秀的文档分割处理库了,功能虽然全面,还是还有不少可以优化的地方,后续也会支持其他向量化模型,并且可以跟LlamaindexLangchain等框架无缝衔接,应该值得持续关注。

2024-04-19 12:30:00 1198

原创 向量数据库之Lancedb学习记录

Lancedb是一个用于人工智能的开源矢量数据库,旨在存储、管理、查询和检索大规模多模式数据的嵌入。Lancedb的核心是用Rust编写的,并构建在Lance之上,专为高性能 ML 工作负载和快速随机访问而设计。

2024-04-15 19:25:39 1547

原创 向量数据库Chroma学习记录

Chroma是一款AI开源向量数据库,用于快速构建基于LLM的应用,支持Python和Javascript语言。具备轻量化、快速安装等特点,可与Langchain、LlamaIndex等知名LLM框架组合使用。

2024-04-13 18:00:00 1106

原创 大白话扩散模型(无公式版)

虽然原始论文涉及到的知识包括随机分布,马尔科夫链等,而且推导过程极其复杂,但本文不会深入去推导相关的公式,而是把重心放在思考这个过程以及对其中发现的一些问题进行探讨。,因为一开始图片质量很高,加很小的噪声就发生很大的变化,而越后面的图片含有噪声越多,失真越严重,必须加更大的噪声才能引起较大变化。如果玩过文生图的话就能发现,选择了一定的采样步数后,前几步图片变化非常大,从模糊的噪声逐渐出现轮廓,后面几步基本不变,只是一些细节发生了变化。,然后我们用来进行训练一个模型,拟合训练数据的分布之后,就可以预测出。

2024-03-24 13:23:39 828

原创 零基础小白也行,只用一行命令在自己的电脑跑大模型

目前该项目更新非常快,从路线图看后期还会支持更多模型和功能。相比于研究更强大的模型,减少技术的使用门槛对于普通人来说,显得更有实际意义。

2024-03-12 18:00:00 1575

原创 llm构建数据标注助手

在LLM出现之前,传统的深度学习模型(包括CV和NLP)就已经需要大量的数据进行训练和微调。没有足够的数据,或者数据需要进行二次加工(比如标签标注),这些问题都成为限制深度学习模型泛化的关键。对于第一个问题,一般就是从网络上爬虫或者花大价钱从数据供应商购买数据;对于第二种情况,一般是找外包进行标注,这在业界非常普遍。

2024-03-10 09:52:29 1046

原创 Chat2table,简易表格分析助手

之前用智谱AI的Chatglm3-6b模型写过一个简单的论文阅读助手,可用来辅助论文阅读等。而像表格,如Excel、CSV文件等内容的分析,也是不可忽略的需要,因此本文同样使用Chatglm3-6b来搭建一个表格分析助手,用于快速分析表格的内容,提取有效的信息。ChatGLM3 采用了全新的对话格式,除最基本的对话外,还支持工具调用和代码执行。简单来说,代码执行属于工具调用的子类,只是提示词不一样,而这两种功能是通过修改微调阶段的提示词来实现的。

2024-02-29 12:00:00 848

原创 8k中英双语文本嵌入模型效果初探

向量模型用于生成向量表示,被广泛应用于检索、分类、聚类或语义匹配等传统的自然语言处理任务。到了大模型时代,由于上下文长度的限制,需要压缩、存储和查询大量的信息,这就需要用到向量模型对输入的文本进行向量化表示,然后再喂给大模型,以得到期望的输出。,例如处理数十页的报告综述等。

2024-02-25 10:10:18 370

原创 大语言模型常见的文本切分之语义嵌入

选择了一篇新闻稿,有比较明显的段落区分,每个段落由若干句子构成,可用于验证切分效果。

2024-01-24 12:00:00 452

原创 大语言模型常见的文本切分方式整理汇总

本文整理了一些简单的文本切分方式,适用于大语言模型经典应用RAG或相似场景。

2024-01-20 08:51:17 728

原创 零样本从文本直接生成视频:Text2video-zero的试用和启发

前段时间,一款AI视频应用及其创始人刷爆了科技圈,顺便还带火了自家公司的股票。这是一家名为pikaai的初创公司,他们的主打产品是一款文本生成视频应用Pika 1.0。对于AI生成图片大多数人已经不陌生了,甚至已经用的非常熟练,其中不乏常见的Stable Diffusion以及Midjourney等各种模型和产品。反观文生视频模型及其衍生产品却进展迟缓,尽管几家当红的公司宣传自己的产品非常厉害,但实际上都面临或多或少的问题。

2024-01-13 16:19:01 1195

原创 基于Gradio实现的AI扩图(Outpainting)

Outpainting(图像外部填充)是一种图像处理技术,与Inpainting(图像内部填充)相反,可以根据现有图像的内容、风格和上下文,合成与原始图像相协调的新内容,从而扩展图像的视觉范围。通俗地说,Outpainting也属于图像编辑,只是把Mask区域改成往外扩展而已。

2024-01-02 23:11:15 1474 1

原创 Stable Diffusion中的图像修改尺寸和编辑工具实现

在图生图中,使用Stablediffusion的pipeline来构建Webui应用,如果直接把参数传给pipeline是无效的。__call__参数中虽然有单独的weight和height这两个参数,但最终图像尺寸实际上是由传入图片的尺寸决定的,因此需要定义函数来做原始图片的尺寸变换,达到用参数来控制输出图像尺寸的目的,这可以通过resize调整图片尺寸大小来实现。上传一张初始图片图片宽度和高度按照比例调整,缩放到1.2倍,高度和高度同步变成1232。

2023-12-23 12:30:00 840

原创 Fastapi的服务端后台任务简介

在 fastapi 中,可以使用后台任务(Background Tasks)来异步执行一些耗时的操作,而无需等待其完成。后台任务非常适用于需要进行一些异步处理的场景,例如发送电子邮件、处理图像、推送通知等。

2023-12-22 16:17:16 775

原创 几行代码实现可视化的文生图采样过程

Huggingface的实现了端到端的文生图功能,用户输入文字,即可得到最后的图片。但是在某些场景下,如果需要获取中间过程的图片,用于优化长时间等待过程的用户体验,就只能通过修改源码进行实现了。

2023-12-21 12:00:00 419

原创 进程与线程,并发与并行,异步与同步等区别与联系

进程属于操作系统的概念,操作系统中一个正在运行的程序就是一个进程,这个程序除了会用到CPU和内存之外,可能还会用到网络、磁盘等设备,因此进程就是操作系统对一个程序管理的抽象集合。线程属于进程的一个子集,是程序执行的最小单元,也即程序执行的指令。进程是操作系统资源分配的基本单位,线程是CPU调度的基本单位。因此。

2023-12-16 11:10:07 351

原创 Stable Diffusion动态加载Lora过程中的实验、原理与说明

本文实验了动态加载Lora中出现的一些现象,并分析了底层的原理

2023-12-13 12:00:00 2983 5

原创 可能是最简单易用又免费的论文阅读助手了(最终版)

这篇文章的工作在之前的基础上,改进点如下:更简单的交互方式、更简单的论文提取方法、更快的响应

2023-12-09 23:15:58 382

原创 FastAPI接口请求带来的一系列疑问与收获

我用的接口是用Ray serve进行部署的,Ray是一个分布式的计算框架,包含数据、模型、训练、微调和部署整套流程的服务,这里可以简单理解为该模块是在Fast Api的基础上做了些封装和完善。我定义的接口是一个post的接口,部署起来后,返回的状态码一直显示错误,一直没发现存在什么问题,后面经过多方搜寻,发现错误的原因是传递的参数中存在无法识别的参数。经过查询后,原来是因为post接口的参数不能随意起,必须以json的格式传送

2023-12-07 23:23:53 1052

原创 命令行快速启动论文阅读助手与交互

上一篇文章介绍用阿里云免费GPU搭建论文阅读助手,反响比较热烈,因此打算把项目整理汇总,方便普通用户直接调用。

2023-12-04 23:21:10 350

原创 无需langchian,5分钟搭建专属论文阅读助手

langchain是一个非常热门的大模型应用开发框架,可以帮助我们快速开发基于大模型的下层应用。本文不打算使用langchain开发,而是用少量代码实现论文阅读助手这个功能。

2023-11-30 23:12:35 978

原创 白嫖免费GPU进行AI画图

免费使用GPU画图

2023-11-25 17:00:07 427

原创 Stable Diffusion中的插件功能是怎么实现的

通过一个翻译插件项目,我了解到怎么在原始的的gradio项目中添加额外的插件功能,而无需进行太多改动。而且这些插件功能通过js可以实现各种额外的功能,大大弥补了gradio的弱点。

2023-11-21 23:31:11 131

原创 几条命令查询ip地址

通过搜索引擎的到如下结论:1、公共IP地址外部(全球)覆盖、私有ip地址内部(本地)覆盖面。2、公共IP地址用于在您的专用网络之外通过Internet进行通信;私有ip地址用于在您的私人网络内与您家中或办公室中的其他设备进行通信。3、公共ip地址由您的互联网服务提供商分配和控制;私有ip地址分配给专用网络中的特定设备。

2023-07-20 17:03:02 864

原创 pytest用法

最近在做一个机器学习工具包,需要对其中完成的部分功能进行测试,在jupyter-notebook环境测试单个函数功能没问题,但是没有对整个模块进行测试,无法联调,说不定有其他异常没发现,因此尝试用python中的pytest模块进行测试。

2023-07-08 11:38:39 58

原创 通俗易懂的注意力机制attention

简单来说,注意力通常对不同的item感兴趣程度、注意力分布不同,考虑对不同的item施加不同的权重,即求当前query关于不同key下的注意力分布及当前query的注意力分数。某些特征就会主导某一次的预测,就好像模型对某些特征更加专注。如果我们说加权求和就很容易理解,但是说成注意力机制,就感觉高大上了许多,也许这就是论文吧。。

2023-04-02 11:32:20 643

原创 基于元路径的利用多级社会背景信息的虚假新闻检测

论文解读分析

2022-10-08 12:19:25 405

原创 图神经网络之基础

图的基础知识入门

2022-10-04 11:41:01 526

原创 集成学习之极限梯度提升

本文简单介绍了一下集成学习中的xgb模型

2022-10-03 17:27:39 379

转载 Fraudar算法在京东关系网络反欺诈中的应用

复杂网络关系下的欺诈社群发现方法:Fraudar之于二部图反欺诈。

2022-09-30 09:48:08 706

原创 k均值聚类

在机器学习领域,主要有两大类学习任务:有监督学习和无监督学习(也有一些分法认为还有半监督学习,即是有监督和无监督的结合)。

2022-09-15 14:34:28 398

原创 一种基于多图注意力机制的虚假新闻检测方法

论文阅读,一种用多图注意力机制来实现虚假新闻检测

2022-09-08 23:41:40 963 1

原创 特征值分解、奇异值分解、满秩分解与QR分解

先说一下向量和矩阵的一些几何意义。 (1)向量与实数相乘就是对向量做伸缩变换(很容易理解); (2)矩阵某种意义上就是一种变换,所以向量乘以矩阵就是对向量做某种变换,矩阵与该矩阵的特征向量相乘是对该向量的伸缩变换,与非特征向量相乘是旋转变换。 此外,从特征向量的定义公示AX=λX也可以得出矩阵与该矩阵的特征向量相乘是对该向量的伸缩变换,因为等式右边实数乘以向量等于对向量伸缩,所以左边意义.........

2022-06-24 16:33:00 343

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除