- 博客(19)
- 收藏
- 关注
原创 测试llama3-8b的信息抽取能力 2
通过简单的主观测试发现,即使是相对简单的NER任务,原始的llama3-8b量化模型也不能满足信息抽取的需求。我们找到了面向信息抽取的微调好的LoRA,加载该模型测试效果。
2024-06-13 16:04:22 207
原创 Debug记录:TypeError: TextEncodeInput must be Union[TextInputSequence, Tuple[InputSequence, InputSequen
如何批量编码数据。encode方法仅针对单条数据虽然存在decode方法对应的batch_decode方法,但是,并不存在与encode对应的batch_decode方法
2024-06-11 18:32:43 638
原创 测试llama3-8b的信息抽取能力 1
目前开源大模型在信息抽取任务上做的怎么样了。测试llama3-8b模型,通过huggingface transformers库加载模型并进行推理。
2024-06-05 16:55:55 253
原创 面试问题记录(LLM)
一个良好Prompt的结构是怎么样的,说一下关于如何调整Prompt的经验针对一次生成,如何自动的判断生成的质量是否符合要求? 是通过规则还是利用LLM反馈? 具体如何实现??微调一个信息抽取LORA模型,如何构造设置微调数据?如何进行多轮对话? 多轮对话时如何管理session?有没有比较过量化前后的差别?BF16 和 FP16 有什么差别?有没有用过GPT Store这类开发平台?说一下你对Agent的理解?
2024-05-24 07:07:37 95 1
原创 DEBUG记录 RuntimeError: cuDNN version incompatibility
解决pytorch报错 RuntimeError: cuDNN version incompatibility
2024-05-08 10:02:53 569 1
原创 GPT是否解决了信息抽取问题?
在信息抽取任务上,GPT还落后于专用的有监督模型; 对于困难的任务,落后的更多;提出使用软匹配更准确的评估效果;对鲁棒性和错例进行了分析
2024-03-28 18:07:29 979 2
转载 使jieba用户词典支持空格
将原始jieba字典中的空格更改为 @@ 1.原来:雅不可攀 3 nr 2.现在:雅不可攀@@3@@nr将自定义用户词典加入的词与词性中间的空格更改为@@ 1.原来:牵连关系 50 n 2.现在:牵连关系@@50@@n 更改jieba根目录下的__init__.py文件下代码: 1.原来:re_userdict = re.compile('^(.+?)( [0-9]+)?( [a-z]+)?$', re.U) 2.现在:re_userdict = re.compile('
2022-05-31 14:59:16 325
原创 常用公式latex记录
余弦相似度:cos(θ)=∑i=1n(xi×yi)∑i=1n(xi)2×∑i=1n(yi)2cos(\theta) = {\sum_{i=1}^{n}{(x_i \times y_i)} \over {\sum_{i=1}^{n}{(x_i)^2} \times \sum_{i=1}^{n}{(y_i)^2}}}cos(θ)=∑i=1n(xi)2×∑i=1n(yi)2∑i=1n(xi×yi)cos(\theta) = {\sum_{i=1}^{n}{(x_i \times y_i)} \
2022-01-13 10:09:10 943
原创 安装Stanza(处理Stanza无法下载语言模型的错误:ConnectionError)
安装Stanza处理Stanza无法下载语言模型的错误:ConnectionError
2021-12-11 09:58:54 6722 7
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人