DataWhale暑期夏令营第一期——大模型技术方向task2笔记

最新推荐文章于 2024-09-15 15:29:29 发布

zhangakirn

最新推荐文章于 2024-09-15 15:29:29 发布

阅读量350

点赞数 3

文章标签：人工智能 python 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangakirn/article/details/140165391

版权

TASK 2 笔记

数据分析

可以先通过对标签中各个项进行数据分析（使用values_count方法），可以得到主要任务的各个指标的值分布情况。

我认为这一步的作用：

帮助理解数据。
大模型的本质还是概率生成，通过prompt提示词去进行生成

Baseline优化思路

1.数据处理

角色合并：将同一个说话人的话合并。频繁的角色转换可能会增加大模型处理数据的困难。
- 个人预想的思路：可以对对话数据进行编号，将编号和对应语句封装为一个tuple，将每个角色的所有语句进行合并，减少频繁的角色转换。
信息清洗：去除一些不必要的信息（表情，图片，链接等，这些数据没有关联性，是无法解析的脏数据）
- 模型的主要任务还是从文本中提取关键词
- 表情，图片，链接并不是我们要提取的对象
- 去掉以上这些部分的影响不大，因为这些信息本来就很难被大模型读取
信息总结：将聊天信息总结（总结之后的数据有可能会对后续大模型的关键字抽取工作造成影响）
- 将聊天信息总结为一段话或者其他形式，这样做可能会提高信息的可阅读性。但是离开了真实的对话环境。
- 某些情况下，对聊天信息进行预处理和总结可以减少噪声，提高后续处理的效率。但这也取决于模型是否能够从中获益。

2.Prompt工程

- 任务信息分析：在设计Prompt时，理解每个任务的信息需求是非常重要的。这包括如何指导模型提取特定的信息，并避免提取不相关的信息。
任务2～10:
- 可以根据任务1得到的客户姓名以及数据分析中得到的值，让llm去做选择题，编写出Prompt，让大模型去运行
- 缺点：费token
调优：
- 使用训练集去调优。
- 根据评价指标写一个评价函数，让大模型使用评价指标和标签对抽取进行一个评价
调优思路：
1. 数据分析
2. 保留基本字段信息，其他字段为空
3. 全部字段为空（效果最好？）

问题

1. 为什么全写空，结果会好呢？

当数据中空值较多时，模型可能会学习到一种倾向，即忽略缺失或不确定的信息。在这种情况下，如果测试集中的空值与训练集类似，模型就会表现得更好，因为它能够预期到这些缺失值。

2. 大模型提取出多余信息，如何解决？

可以通过后处理步骤来清理模型可能产生的多余信息。例如，在提取JSON数据时，可以设置一些规则来过滤掉不符合格式或逻辑的信息。

3. Prompt原理？

在自然语言处理中，Prompt工程的核心思想是利用预先设计的指令和信息来引导模型生成预期的输出。在Transformer或BERT这样的模型中，输入的序列通过自注意力机制捕捉不同部分之间的关系，而好的Prompt可以更有效地引导模型关注于关键信息，从而提高预测的准确性。

在多选题的Prompt设计中，q,k,v指的是query, key, value这三个组件，在注意力机制中起着关键作用。query用于查找与之相关的信息（key, value），而value则包含了实际的信息内容。通过精心设计这两个部分，可以提高模型处理特定任务的性能。

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

zhangakirn CSDN认证博客专家 CSDN认证企业博客

码龄2年

13: 原创

60万+: 周排名

8万+: 总排名

8741: 访问

: 等级

343: 积分

149: 粉丝

198: 获赞

14: 评论

169: 收藏

私信

关注

热门文章

最新评论

用于讲话者视听追踪，基于自监督学习的多模态感知注意力网络——论文阅读
普通网友: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
用于讲话者视听追踪，基于自监督学习的多模态感知注意力网络——论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
DataWhale 数据可视化笔记
CSDN-Ada助手: 恭喜用户写下了第10篇博客《DataWhale 数据可视化笔记》！持续创作是一个不断进步的过程，你的努力和坚持让读者们受益匪浅。接下来，或许可以考虑深入探讨数据可视化的实践案例，或者尝试结合其他领域与数据可视化的结合，让读者们更加全面地了解这一领域。希望你能继续保持热情，不断学习进步，期待你的更多精彩作品！
Datawhale动手学数据分析第三阶段笔记
CSDN-Ada助手: 恭喜用户第10篇博客的发布！看到您对Datawhale动手学数据分析第三阶段的笔记总结，真是辛苦了。希望您能继续保持这样的学习热情和创作激情，坚持不懈地分享您的学习心得和体会。下一步建议可以尝试结合实际案例进行分析，或者深入探讨某个数据分析技术的原理与应用，让读者能更深入地了解数据分析的世界。期待您更多精彩的作品！
DataWhale动手学数据分析第二阶段笔记
CSDN-Ada助手: 恭喜您完成了第9篇博客《DataWhale动手学数据分析第二阶段笔记》，持续创作不易，您的努力和坚持可圈可点。接下来，建议您可以尝试深入挖掘数据分析领域的一些具体案例，结合实际问题进行分析，这样可以更好地提升自己的数据分析能力。期待您的下一篇作品！愿您在学习和创作的路上越走越远，不断进步！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。