自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Datawhale AI 夏令营学习笔记——科大讯飞AI大赛(基于结构化数据的用户意图理解和知识问答挑战赛)

摘要:构建铁路问答模型需攻克三大难点——复杂查询处理(跨车次计算/时间推算)、效率平衡(响应速度占60%权重)和鲁棒性要求。关键技术包括:1)动态问题生成与数据清洗标准化;2)教师模型思维链注入+学生模型推理痕迹保留;3)预索引/模板化等速度优化组合拳。实践需注意LoRA微调降低成本,验证集需覆盖20%异常样本。关键策略是优先确保准确率>92%再优化速度,并建立模型校验-规则校验-人工抽检三重保险机制,防范时间跨日等隐蔽风险。

2025-07-21 20:07:21 775

原创 Datawhale AI 夏令营学习笔记——科大讯飞AI大赛

本次“用户新增预测挑战赛”属于典型的二分类任务,目标是通过分析讯飞开放平台的用户行为数据,预测用户是否为新增用户。通过本次比赛,我体会到数据科学在实际业务中的巨大价值,例如精准预测用户增长趋势、优化产品策略等。本次Baseline方案采用了LightGBM模型,结合五折交叉验证和F1-score阈值优化,兼顾了模型的泛化能力和评估指标的最优性。F1-score优化策略:https://neptune.ai/blog/f1-score-accuracy-roc-auc-pr-auc。

2025-07-09 17:59:02 702

原创 Datawhale AI 春训营学习笔记——用AI生成化学分子结构

基于扩散模型(Diffusion Model),通过生成式AI高效生成10,000个具有潜在应用价值的分子3D结构,用于第三届世界科学智能大赛材料设计赛道初赛。:增加步数(如1000)可能提升生成质量,但会增加计算成本。:支持根据物理化学属性(如HOMO、LUMO)定制分子。:根据显存调整,较大批大小(如128)可能加速收敛。:单轮训练(含数据增强、损失计算、反向传播)。:分子稳定性分析(有效性、唯一性、新颖性)。:动态梯度裁剪(基于历史梯度均值和方差)。:3D分子数据增强(随机旋转原子坐标)。

2025-04-29 18:55:07 1302

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除