自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

MCAC_123的博客

原创 Datawhale X 魔搭 AI夏令营 AIGC Task02

定义了一个自定义的Dataset类，用于封装数据加载逻辑，并使用DataLoader进行批量加载。# ...（CustomDataset类的定义）# ...（模型预测的代码）生成的连环画图片栩栩如生，但是细节方面不够完美，期待Task03的baseline02。使得生成的图像完美又生动。

2024-08-14 14:49:15 282

原创 Datawhale Al夏令营大模型（微调）Task02

我们在保持训练代数为10，学习率为0.00008,由上1表可知，改进的prompt对于大模型的得分是有改进的。调节出这个得分60.5的prompt后，我停止了对prompt的改进，接着来扩充数据。由于是高考出题，我选择的是2023年与2019年的高考全国范围的语文与英语试卷，来扩充数据集。第三步，将增加好的训练集上传到云端，加上最好的prompt生成最新的output文件。(6)分析作者在文中表达的情感态度，包括其对主题的喜好、厌恶、赞赏或批评等。(8)基于文中的论点和论据，推断作者写作本文的主要意图。

2024-08-14 14:09:45 646

原创 Datawhale AI夏令营大模型（微调）Task01

通过昨天晚上的讲解学习到，提升本次大模型得分的关键在于改进prompt和扩充数据和数据增强。这里就很伤心，看群里的同学按照教程做出来的成绩是70多，说也没有改任何参数，就能得到，而且每个人运行后的得分都不一样。不知道为啥差距好大。(7)考虑文中提到的文化元素或背景，讨论这些元素如何影响作者的观点和论证。下表2为运行的两个可改变的参数学习率和训练参数改变后的得分对比。由上表可知，本次的大模型，增大训练次数与改变学习率，没有大的成绩提高。去提高程序预测准确性，所以这次对大模型的训练的难点在与大模型所需的。

2024-08-11 20:17:16 856

原创 Datawhale X 魔搭 AI夏令营第四期 Task01

以文生图是AIGC ( AI Generated Content ）框架中的一个关键技术，通过文字描述，将文字转化为图像并展示出来。以文生图具有白动化程度高、精度高、可扩展性强、可定制化等优势，具有广泛的应用前景，可以为人们提供更便捷高效的绘图解决方案。

2024-08-09 18:00:24 1021

原创 Datawhale AI夏令营第三期 Task03

对于数据集里的特征序列的处理，作为非数值的文本特征需要经过特殊的编码才能对特征进行处理，这是比较难的一部分。转眼又到了第三期结束了，这期的生物学难度挺大，涉及的专业很多，我的大多数时间不是在读懂baseline1和2的代码解读和帮助文档，就是在调参的路上。对于GC含量特征的处理，分享会的大佬说可以自己再加几条，我实在能力不允许加不进去。因为Task03里面的代码为给完全，所以这段代码的实现需要借助Task01里面对于GenomicTokenizer和GenomicVocab的定义需要加入进来。

2024-08-02 23:05:48 901

原创 Datawhal AI 夏令营第三期-- Task01

在本地部署的时候也是花了很大功夫，在基本的训练模型生成之后，接着去预测测试集这一部分对代码的调试是一个难点。下面是我自己添加的测试集预测的输出代码，比Datawhale给的要简略一点，但是功能是相同的。第二期是三特征输入的时序预测，这次是多特征输入的回归拟合预测。数据集的量减少了，但是本质是一样的，主要是回归拟合。我利用SVR预测后的结果要好于运行200epochs的baseline，为0.69左右，以下是我用的SVR的一种代码，和大家一起交流学习。这段代码是可以运行通的，大家可以试一试。

2024-07-27 22:07:10 264

原创 Datawhale AI 夏令营 Task03

接着，通过学习别人的笔记，通过对Task02中单一lightgbm的特征工程改进会提升运行结果的分数。后来观察到Task03中还提供了在数据建立特征工程后，通过三者堆叠融合后可输出结果，我又进行了尝试，本次代码运行耗时较长，且代码长度也比较长，可相对较好的是结果提交后有了不错的分数提升，分数从257.7来到了233.1。在这段程序中，我输出了三者融合后的结果，也输出了三者各自的预测的数值，分别的得分为260.3605、262.43793与259.9，相比来说相互融合的方式还是效果好一点。

2024-07-20 20:43:07 956 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

MCAC_123 CSDN认证博客专家 CSDN认证企业博客

码龄1年

IP 属地：甘肃省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

7: 原创

45万+: 周排名

9万+: 总排名

4928: 访问

: 等级

170: 积分

72: 粉丝

100: 获赞

1: 评论

67: 收藏

私信

关注

热门文章

最新评论

Datawhale AI 夏令营 Task03
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Datawhale AI 夏令营 Task03
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/619179908。

最新文章

提示

确定要删除当前文章？

取消删除