- 博客(2)
- 收藏
- 关注
原创 【Datawhale夏令营】大模型技术方向笔记 #AI夏令营 #Datawhale #夏令营
一、跑通baseline二、 赛事解读+基础baseline讲解从给定的与的群聊对话中, 提取出指定的字段信息,即企业收集了大量的客服与客户之间的对话记录,这些对话记录属于非结构化数据,而企业想通过大模型技术,将它们变为结构化数据,以用于后续的数据治理和数据挖掘,为企业带来更多价值。输入:客服对话记录输出:结构化json数据本赛题属于NLP字段提取,从较长一段文本中提取出21种信息字段,难度进行了人为的分级评定。prompt工程(对此部分掌握不够深入需进一步学习)
2024-07-07 23:30:45 219
原创 2024 Datawhale分子性质AI预测挑战赛#AI夏令营 #Datawhale #夏令营
一、跑通baseline二、构思idea,改进baseline1.特征工程可能不完整:只删除了 train 数据中的两个列,但没检查 test 数据中是否也存在这些列(虽然从描述中看 test 数据不包含这些列)。此外,应该检查所有数据类型和缺失值,并可能进行填充或删除。2.预测数据集的列选择:在预测时,从 test 数据集中选择了从第二列开始的所有列(test.iloc[:, 1:]),但之前对 train 数据集的处理是从第三列开始的(train.iloc[:, 2:])。
2024-07-07 23:18:06 681
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人