自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(92)
  • 收藏
  • 关注

原创 处理器列表

intel 奔腾 赛扬。至强 Xeon-W9。至强 Xeon-金牌。

2024-06-23 13:06:31 83

原创 李小文院士

布鞋院士李小文:考试只考60分,拒诱惑毅然回国,每天一斤二锅头

2024-06-23 12:52:18 62

原创 RAG相关学术研究

Evaluation of Retrieval-Augmented Generation: A Survey

2024-06-22 23:56:33 109

原创 Retrieval Augmented Generation (RAG): A Comprehensive Visual Walkthrough

Retrieval Augmented Generation (RAG): A Comprehensive Visual Walkthrough

2024-06-22 23:52:28 83

原创 embedding模型选择

Hugging Face推出的嵌入模型排行榜MTEB。

2024-06-22 23:37:34 103

原创 RAG Fusion

优点缺点。

2024-06-22 22:57:30 61

原创 RAG优化

RAG(检索增强生成)的优化策略主要包括数据清洗、分块处理、嵌入模型的使用、预检索优化、检索和后检索流程的优化,以及高级优化技术如查询环节优化、检索环节的优化、融合或混合搜索、多种切分方式并行查询、rerank、以及模型微调等。检索环节的优化:采用总分层级索引、父子层级索引、融合或混合搜索、多种切分方式并行查询等方法,提高检索的准确性和稳健性。检索和后检索流程优化:通过有效的查询转换和提示工程技术,增强RAG工作流程的每个组成部分。

2024-06-22 21:31:49 168

原创 分布式训练框架

deepspeedfsd。

2024-06-22 21:09:25 88

原创 RAG和agent框架选型

langChainautoGenmetaGPT。

2024-06-22 21:06:27 104

原创 大模型应用开发-向量数据库选型

FAISS:适合需要高性能和低延迟的场景,但实现较为复杂。Annoy:轻量级、适合读取多于写入的场景,但不支持动态更新。HNSW:性能优越,特别适合高维数据,并且支持动态更新。Milvus:企业级解决方案,支持多种索引和动态数据管理,适合大规模分布式环境。Pinecone:全托管服务,易于使用和管理,适合快速部署需求。Weaviate:支持语义搜索和知识图谱,适合复杂的数据集成场景。根据具体的应用需求选择合适的向量数据库,可以显著提升系统的性能和效率。

2024-06-21 11:00:26 309

原创 ghelper

https://ghelper.net/

2024-06-20 23:43:31 87

原创 django网站前端开发-上传文件

通过以上步骤,您已经在 Django 项目中创建了一个允许用户上传 PDF 文档的功能。用户可以通过点击上传按钮选择文件,并将文件上传到服务器。上传的文件将保存在指定的目录中。django在做网站前端开发时,在网页上嵌入一个上传pdf文档的按钮,点击该按钮,弹出选择文件。

2024-06-20 22:33:18 933

原创 chromadb

Chroma是一款AI开源向量数据库,用于快速构建基于LLM的应用,支持Python和Javascript语言。具备轻量化、快速安装等特点,可与Langchain、LlamaIndex等知名LLM框架组合使用。

2024-06-20 15:56:37 501

原创 基于RAG的论文信息检索(2)-向量召回

https://github.com/wenjunna/ragdemo-02

2024-06-18 21:08:13 127

原创 RAG项目工期

term , 向量 , 大模型。第一期,基于term的检索,大模型生成。上传pdf,一键解析,上传多个pdf。第三期,使用向量检索,向量数据库选型。第二期,搭建前端界面,落地。

2024-06-18 17:59:46 181

原创 大模型运行可视化工具

https://bbycroft.net/llm大模型预训练任务

2024-06-18 15:36:53 385

原创 leetcode153. 寻找旋转排序数组中的最小值

中间值如果小于等于最右边的值,去左边部分找;中间值如果大于最右边的值,去右半部分找。

2024-06-17 17:53:42 297

原创 langchain

langchain-模型智谱AI:ChatGLM API调用说明

2024-06-15 12:50:37 244

原创 英伟达显卡系列及其用途

英伟达(NVIDIA)生产了多种系列的显卡,每个系列都针对不同的使用场景和用户需求进行了优化。

2024-06-13 23:57:00 314

原创 大模型API和私有化部署的区别与联系

大模型 API 和私有化部署各有优劣,选择合适的方案应基于具体的应用需求、资源条件和数据安全考量。

2024-06-13 23:28:55 403

原创 Llama2微调

https://huggingface.co/meta-llama/Llama-2-7b-hfhttps://huggingface.co/meta-llama/Meta-Llama-3-8BLlama3微调教程:超简单,人人都可以打造属于自己的GPT!

2024-06-13 22:29:53 278

原创 基于RAG的论文信息检索(1)-term召回

有一篇中文论文,结合论文信息和大模型的生成能力,搭建一个RAG模型,向模型提问关于该论文的一些问题,模型给出答案。elasticsearch/openai/RAG/Prompt/大模型外部知识库从pdf格式的论文中提取,大模型使用的是kimi,调用kimi api,外部知识以prompt的形式输入大模型,大模型综合用户提问和检索结果,生成答案。下面以本人硕士毕业论文做测试。

2024-06-13 00:10:39 761

原创 大模型快速私有化工具ollama

ollama目前支持的模型:https://ollama.com/library。Ollama 提供了一种在本地运行大语言模型(LLMs)的方法。ollama官网:https://ollama.com/

2024-06-11 11:51:27 294

原创 大模型与知识图谱

大模型和知识图谱怎么结合使用?有了大模型还需要知识图谱吗?

2024-06-10 12:53:40 165

原创 Moonshot AI API使用(3)-ChatGPT和kimi对比

使用关于歌手李健的一些问答,进行对比。整体感觉ChatGPT思维更清晰,逻辑更严谨,总结概括能力更强。

2024-06-10 10:44:10 1091

原创 让大模型成为你的得力助手(4)-旅游客服

开发一个某旅行社旅游产品客服对话机器人。

2024-06-08 16:49:01 75

原创 elasticsearch安装与使用(4)-搜索入门

【代码】elasticsearch安装与使用(4)-搜索入门。

2024-06-08 16:44:24 282

原创 常见的自然语言处理任务

情感分析(sentiment-analysis):对给定的文本分析其情感极性文本生成(text-generation):根据给定的文本进行生成命名实体识别(ner):标记句子中的实体阅读理解(question-answering):给定上下文与问题,从上下文中抽取答案掩码填充(fill-mask):填充给定文本中的掩码词文本摘要(summarization):生成一段长文本的摘要机器翻译(translation):将文本翻译成另一种语言特征提取(feature-extraction):生成给

2024-06-07 20:38:46 86

原创 Moonshot AI API使用(2)-环境变量配置和简单对话demo

api key有多种使用方式,添加环境变量这种是最安全的,强烈推荐!在打开的文件中添加下面两行。

2024-06-07 15:57:15 450

原创 Moonshot AI API使用(1)-获取MOONSHOT_API_KEY

用户注册,使用微信扫码登录。把这个key复制下来。

2024-06-07 15:16:45 211

原创 让大模型成为你的得力助手(3)-OpenAI API

Chat API:多轮对话,但可以用对话逻辑完成任何任务,包括续写文本。Completion API:续写文本,多用于补全场景。其它大模型的 API 基本都是参考 OpenAI,只有细节上稍有不同。有的大模型只提供 Chat。

2024-06-07 14:50:00 165

原创 让大模型成为你的得力助手(2)-Prompt进阶技巧

思维链自洽性思维树。

2024-06-07 13:55:14 125

原创 让大模型成为你的得力助手(1)-使用合适的Prompt

一个认知:不是大模型能做什么,而是你想让大模型做什么

2024-06-06 17:39:07 383

原创 simCSE文本语义向量表示(2)-有监督微调

有监督微调。

2024-06-06 17:15:51 329

原创 elasticsearch安装与使用(3)-索引库可视化

把新建的index_test倒排索引库可视化Stack Management->Index Management,查看新建的倒排索引库index_testDiscover。

2024-06-05 13:06:14 443 1

原创 elasticsearch安装与使用(2)-基于term匹配的简单搜索引擎搭建

把一篇pdf论文解析后,放入es数据库中,建立倒排索引表,并实现简单搜索。

2024-06-05 12:15:51 725 2

原创 docker安装及常见命令

历史版本docker下载。

2024-06-04 22:48:08 152

原创 elasticsearch安装与使用(1)-使用docker安装Elasticsearch

通过Kibana可以可视化的管理es数据库里的数据。密码:N-sf6R*O0Ur344otTfzc。注意证书,证书从容器中复制出来后,我存放在。注意用户名密码最好加上双引号。用户名:elastic。

2024-06-04 18:16:08 447 1

原创 nltk安装与使用

自然语言处理工具包,在NLP领域中,最常使用的一个Python库。

2024-06-04 15:21:35 270

原创 文本纠错详解

3、纠错模型优劣评价方法。

2024-06-03 12:35:34 86

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除