自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Datawhale AI夏令营CV图像竞赛(Deepfake攻防)

2.进行数据增强,进行图像大小调整,随机水平翻转,随机垂直翻转。1.修改神经网络模型,在resnet的基础上添加senet模块。

2024-07-17 22:13:25 85

原创 Datawhale暑期夏令营 大模型信息抽取-学习笔记

从给定的群聊对话数据中,提取出指定的字段信息,具体待提取的字段信息如下。待抽取的字段名称包括基本信息,咨询类型,意向产品,购买异议点等,字段提取的难易程度分为1、2、3三种,同时还要考虑到它们是否是单值的,是否为空,答案是否唯一。群聊对话分角色要素提取是企业营销和服务的重要策略,通过分析这些数据,企业可以更好地理解客户需求,提供个性化服务,提升客⼾满意度和商业价值。大模型偶尔会出现缺少字段的情况,所以需要对大模型抽取的结果进行字段格式的检查以及缺少的字段进行补全。这里特征工程主要指的是prompt工程。

2024-07-01 17:12:57 223

原创 Datawhale暑期夏令营 分子性质AI预测-学习笔记

9 模型应用:训练 CatBoost 分类器,并将返回的测试集预测结果 cat_test 用于生成提交文件,根据预测概率 cat_test 生成二元标签,概率大于0.5的预测为1,否则为0,创建一个包含 uuid 和预测标签 Label 的 DataFrame,并将其保存为 CSV 文件。3. 循环执行交叉验证:将数据集随机分成K个子集(或“折”),每次迭代中,选择其中一个子集作为测试集,其余K-1个子集联合作为训练集,重复K次,每次选择不同的子集作为测试集,打印当前折数和随机种子。

2024-06-30 15:26:42 534

原创 大数据学习

hive spark zookeeper k8s machine learning 408

2023-10-09 15:43:41 48 1

原创 10.10

是个重要的日子。

2023-10-09 15:39:09 48 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除