【Datawhale AI夏令营--- 机器学习篇】

一、学习心得。

7.25小结

今天是第一天,主要任务是运行baseline。
首先整理一下今天的收获(先说结论):

1、通过大模型工具来得到自己要的最适合自己的答案。

这个方法大大提高了我的学习效率,在学习机器sklearn的时候时常会遇到一些晦涩难懂的表述,或者一些新的单词,而通过提问ai大模型,大大加深了我的理解,让我有兴趣去探索未知的东西,同时兼具广度和深度,我自认是一个学习能力不是很突出的人,从前读高中的时候羡慕别人脑子就是转的快,就是很快能理解很难懂的东西,但随着ai大模型的出现,以及我自己切身体会,理解东西往往不需要自己去钻细枝末节,ai可以辅助我们理解,建立最适合我们大脑的神经链接
这是时代的宝藏!而我们很幸运成为最早的一批他的享有者,我们要意识到它将颠覆我们以往的学习模式

2.知识点小结

1、在sklearn中,几乎所有的机器学习的流程是:

(1)实例化模型(并指定重要参数);
(2)model.fit(x, y) 训练模型;

2、 pandas(用于数据处理和分析),scikit-learn(机器学习库),rdkit(化学信息工具)

3.步骤总结:

导入数据——读取数据——建模(向量化)——机器学习算法处理——加载模型进行预测,并将结果文件导出

4.什么是特征?

特征(Features) 是指从原始数据中提取的,用于表示数据的可测量属性或指标。这些特征被用作模型的输入,以便模型可以学习如何根据这些特征来做出预测或决策。简单来说,特征就是模型用来理解和分析数据的依据。

5.为什么需要特征?

过精心设计的特征,机器学习模型能够更有效地从数据中学习到有用的信息。忽略冗余或无关的信息。

6.题目中的特征是什么?

Reactant1,Reactant2,Product,Additive,Solvent都是由SMILES表示。所以,可以使用rdkit工具直接提取SMILES的分子指纹(向量),作为特征。

  • 18
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值