- 博客(3)
- 收藏
- 关注
原创 Datawhale AI 夏令营学习笔记——科大讯飞AI大赛(基于结构化数据的用户意图理解和知识问答挑战赛)
摘要:构建铁路问答模型需攻克三大难点——复杂查询处理(跨车次计算/时间推算)、效率平衡(响应速度占60%权重)和鲁棒性要求。关键技术包括:1)动态问题生成与数据清洗标准化;2)教师模型思维链注入+学生模型推理痕迹保留;3)预索引/模板化等速度优化组合拳。实践需注意LoRA微调降低成本,验证集需覆盖20%异常样本。关键策略是优先确保准确率>92%再优化速度,并建立模型校验-规则校验-人工抽检三重保险机制,防范时间跨日等隐蔽风险。
2025-07-21 20:07:21
775
原创 Datawhale AI 夏令营学习笔记——科大讯飞AI大赛
本次“用户新增预测挑战赛”属于典型的二分类任务,目标是通过分析讯飞开放平台的用户行为数据,预测用户是否为新增用户。通过本次比赛,我体会到数据科学在实际业务中的巨大价值,例如精准预测用户增长趋势、优化产品策略等。本次Baseline方案采用了LightGBM模型,结合五折交叉验证和F1-score阈值优化,兼顾了模型的泛化能力和评估指标的最优性。F1-score优化策略:https://neptune.ai/blog/f1-score-accuracy-roc-auc-pr-auc。
2025-07-09 17:59:02
702
原创 Datawhale AI 春训营学习笔记——用AI生成化学分子结构
基于扩散模型(Diffusion Model),通过生成式AI高效生成10,000个具有潜在应用价值的分子3D结构,用于第三届世界科学智能大赛材料设计赛道初赛。:增加步数(如1000)可能提升生成质量,但会增加计算成本。:支持根据物理化学属性(如HOMO、LUMO)定制分子。:根据显存调整,较大批大小(如128)可能加速收敛。:单轮训练(含数据增强、损失计算、反向传播)。:分子稳定性分析(有效性、唯一性、新颖性)。:动态梯度裁剪(基于历史梯度均值和方差)。:3D分子数据增强(随机旋转原子坐标)。
2025-04-29 18:55:07
1302
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅