VDB
文章平均质量分 57
向日葵花籽儿
AI工程师:
NLP+AIGC+LLM+后端+DB(向量/非向量)
深度学习/算法优化/基础提升
Python/C++/(Java/JS/HTML)
近期专注内容:RAG | Langchain
展开
-
#VDB# 生成用于MongoDB的objectid
非常简单,先pip第三方库。原创 2024-05-10 14:16:13 · 140 阅读 · 0 评论 -
# VDB | Milvus #milvus 基本操作
向量索引是元数据的组织单位,用于加速向量相似性搜索。如果没有基于向量构建的索引,Milvus 将默认执行暴力搜索。默认情况下,Milvus 不会对少于 1,024 行的 segment 进行索引。要更改此参数,请在 中。Milvus 中的所有搜索和查询操作都在内存中执行。在执行向量相似性搜索之前,将集合加载到内存中。当前版本的 Milvus 仅支持向量场索引。未来的版本将支持标量字段上的索引。通过指定向量字段名称和索引参数来构建索引。,您可以选择决定将数据插入到哪个分区。用于衡量向量相似性的指标类型。原创 2024-03-19 16:35:46 · 627 阅读 · 0 评论 -
#VDB|RAG|AIGC#(含代码)向量检索工具FAISS的搭建和使用教程、经验分享
本文将依faiss使用全流程来教学gpu版的faiss如何使用。原创 2024-02-01 16:31:10 · 1893 阅读 · 0 评论 -
#RAG|NLP|Jieba|PDF2WORD# pdf转word-换行问题
文档在生成PDF时,文宁都发生了什么。本文讲解了配置对象、resources对象和content对象的作用,以及字体、宇号、坐标、文本摆放等过程。同时,还解释了为什么PDF转word或转文字都是一行一行的以及为什么页眉页脚的问题会加大识别难度。最后提到了文本的编码和PDF中缺少文档结构标记的问题。PDF转word更像是一种逆向工程。原创 2024-01-31 17:32:00 · 1451 阅读 · 3 评论 -
#NLP|jieba分词词性对照
jieba词性对照表。原创 2024-01-30 17:13:35 · 769 阅读 · 0 评论