自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 【Datawhale夏令营】大模型技术方向笔记 #AI夏令营 #Datawhale #夏令营

一、跑通baseline二、 赛事解读+基础baseline讲解从给定的与的群聊对话中, 提取出指定的字段信息,即企业收集了大量的客服与客户之间的对话记录,这些对话记录属于非结构化数据,而企业想通过大模型技术,将它们变为结构化数据,以用于后续的数据治理和数据挖掘,为企业带来更多价值。输入:客服对话记录输出:结构化json数据本赛题属于NLP字段提取,从较长一段文本中提取出21种信息字段,难度进行了人为的分级评定。prompt工程(对此部分掌握不够深入需进一步学习)

2024-07-07 23:30:45 219

原创 2024 Datawhale分子性质AI预测挑战赛#AI夏令营 #Datawhale #夏令营

一、跑通baseline二、构思idea,改进baseline1.特征工程可能不完整:只删除了 train 数据中的两个列,但没检查 test 数据中是否也存在这些列(虽然从描述中看 test 数据不包含这些列)。此外,应该检查所有数据类型和缺失值,并可能进行填充或删除。2.预测数据集的列选择:在预测时,从 test 数据集中选择了从第二列开始的所有列(test.iloc[:, 1:]),但之前对 train 数据集的处理是从第三列开始的(train.iloc[:, 2:])。

2024-07-07 23:18:06 681

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除