Datawhale AI 夏令营
文章平均质量分 89
stmwuwangzhifan
这个作者很懒,什么都没留下…
展开
-
DataWhale AI夏令营 AI+化学 task1
导入库代码通过使用函数从文件中读取训练集和测试集数据。使用Morgan分子指纹建模SMILES此步先要完成特征提取,具体来说,有rxnid,Reactant1,Reactant2,Product,Additive,Solvent,Yield字段。其中:rxnid 对数据的id标识,无实际意义Reactant1 反应物1Reactant2 反应物2Product 产物Additive 添加剂(包括催化剂catalyst等辅助反应物合成但是不对产物贡献原子的部分)原创 2024-07-28 13:00:47 · 349 阅读 · 0 评论 -
基于Transformer解决机器翻译任务
基于循环或卷积神经网络的序列到序列建模方法是现存机器翻译任务中的经典方法。然而,它们在建模文本长程依赖方面都存在一定的局限性。对于卷积神经网络来说,受限的上下文窗口在建模长文本方面天然地存在不足。如果要对长距离依赖进行描述,需要多层卷积操作,而且不同层之间信息传递也可能有损失,这些都限制了模型的能力。而对于循环神经网络来说,上下文的语义依赖是通过维护循环单元中的隐状态实现的。在编码过程中,每一个时间步的输入建模都涉及到对隐藏状态的修改。原创 2024-07-20 23:20:49 · 414 阅读 · 0 评论 -
讯飞机器翻译挑战赛题
该方法使得机器翻译系统的评价变得自动、快速、便捷,而且评价过程可以重复。正是由于 BLEU 等自动评价方法的提出,机器翻译研究人员可以在更短的时间内得到译文质量的评价结果,加速系统研发的进程。BLEU4 的计算步骤:分词:将待评估的生成文本和参考文本分词。计算n-gram匹配:计算1-gram、2-gram、3-gram和4-gram的匹配情况。原创 2024-07-17 22:30:11 · 859 阅读 · 0 评论