自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 neo4j apoc使用

neo4j下载与安装apoc

2024-07-20 18:57:05 248

原创 面试问题记录

RAG相关面试问题

2024-06-26 23:31:24 80

原创 测试llama3-8b的信息抽取能力 2

通过简单的主观测试发现,即使是相对简单的NER任务,原始的llama3-8b量化模型也不能满足信息抽取的需求。我们找到了面向信息抽取的微调好的LoRA,加载该模型测试效果。

2024-06-13 16:04:22 207

原创 Debug记录:TypeError: TextEncodeInput must be Union[TextInputSequence, Tuple[InputSequence, InputSequen

如何批量编码数据。encode方法仅针对单条数据虽然存在decode方法对应的batch_decode方法,但是,并不存在与encode对应的batch_decode方法

2024-06-11 18:32:43 638

原创 测试llama3-8b的信息抽取能力 1

目前开源大模型在信息抽取任务上做的怎么样了。测试llama3-8b模型,通过huggingface transformers库加载模型并进行推理。

2024-06-05 16:55:55 253

原创 LangChain学习:RAG检索策略

RAG系统中检索模块的优化策略

2024-05-30 16:52:56 199

原创 面试问题记录(LLM)

一个良好Prompt的结构是怎么样的,说一下关于如何调整Prompt的经验针对一次生成,如何自动的判断生成的质量是否符合要求? 是通过规则还是利用LLM反馈? 具体如何实现??微调一个信息抽取LORA模型,如何构造设置微调数据?如何进行多轮对话? 多轮对话时如何管理session?有没有比较过量化前后的差别?BF16 和 FP16 有什么差别?有没有用过GPT Store这类开发平台?说一下你对Agent的理解?

2024-05-24 07:07:37 95 1

原创 huggingface下载模型&数据集实践

应对网络错误,从huggingface下载模型、数据集

2024-05-09 10:59:51 353 1

原创 DEBUG记录 RuntimeError: cuDNN version incompatibility

解决pytorch报错 RuntimeError: cuDNN version incompatibility

2024-05-08 10:02:53 569 1

原创 面试问题记录(基础&RAG)

算法工程师面试记录20240330,包括python基础\linux基础\RAG工程三个方面

2024-04-30 09:40:59 156 2

原创 面试问题记录(RAG方向)

RAG方向面试问题记录

2024-04-23 21:17:46 453

原创 RAG学习总结

RAG一种将大模型与额外数据源相结合的方法,通过检索的方式获取与问题相关的信息,以此提升模型生成的生成效果

2024-04-14 16:44:53 484

原创 GPT是否解决了信息抽取问题?

在信息抽取任务上,GPT还落后于专用的有监督模型; 对于困难的任务,落后的更多;提出使用软匹配更准确的评估效果;对鲁棒性和错例进行了分析

2024-03-28 18:07:29 979 2

原创 大模型尝试(prompt与结果记录)

尝试大模型 ,记录使用的prompt和获取的结果,以此一窥当前大模型的能力与缺陷。

2023-08-07 14:35:09 292 1

原创 解决linux下matplotlib中文显示异常问题

下载安装字体并修改配置文件从而解决linux下matplotlib中文显示异常的问题

2022-06-27 14:44:40 859

转载 使jieba用户词典支持空格

将原始jieba字典中的空格更改为 @@  1.原来:雅不可攀 3 nr  2.现在:雅不可攀@@3@@nr将自定义用户词典加入的词与词性中间的空格更改为@@    1.原来:牵连关系 50 n   2.现在:牵连关系@@50@@n 更改jieba根目录下的__init__.py文件下代码:   1.原来:re_userdict = re.compile('^(.+?)( [0-9]+)?( [a-z]+)?$', re.U)   2.现在:re_userdict = re.compile('

2022-05-31 14:59:16 325

原创 常用公式latex记录

余弦相似度:cos(θ)=∑i=1n(xi×yi)∑i=1n(xi)2×∑i=1n(yi)2cos(\theta) = {\sum_{i=1}^{n}{(x_i \times y_i)} \over {\sum_{i=1}^{n}{(x_i)^2} \times \sum_{i=1}^{n}{(y_i)^2}}}cos(θ)=∑i=1n​(xi​)2×∑i=1n​(yi​)2∑i=1n​(xi​×yi​)​cos(\theta) = {\sum_{i=1}^{n}{(x_i \times y_i)} \

2022-01-13 10:09:10 943

原创 安装Stanza(处理Stanza无法下载语言模型的错误:ConnectionError)

安装Stanza处理Stanza无法下载语言模型的错误:ConnectionError

2021-12-11 09:58:54 6722 7

原创 Pytorch-GPU安装(选择正确的CUDA版本)

gpu版pytorch安装(如何选择正确的cuda版本)

2021-11-23 17:03:48 5530

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除