Datawhale AI夏令营第三期 AI+物质科学学习记录

我是AI小白,这篇文章的所有优化方向均为猜测
第一部分是固定的

第一部分

Step1:报名赛事!

赛事链接:大赛链接
在这里插入图片描述
没有账号需要先申请账号

Step2:下载baseline代码和数据

在这里插入图片描述
也可以从官网下载数据,可按下面步骤下载赛事数据
在这里插入图片描述

  • 需要认证可按照下方步骤操作
  • 在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

Step3:启动魔搭Notebook!(点击即可跳转)

链接:入口

在这里插入图片描述
在这里插入图片描述
这里需要登录阿里云账户,若没有就去注册一个即可

step4 0分钟体验一站式 baseline!

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
点击mp,再点击code,再按照下面图中所示
在这里插入图片描述
在这里插入图片描述
这个过程应该要五六分钟,等待

执行完成后,下载submit.txt!
当左侧出现submit.txt文件时,即为运行完成,可右键点击文件进行下载

step5:上传分数

链接:入口
在这里插入图片描述
找到submit.txt上传即可,搞定

任务

背景

随着社会经济的不断发展,人们对各种材料、药物及精细化学品的需求日益增长。催化合成作为这些物质制备的关键技术,其重要性愈加显著。

科研人员和产业界致力于开发新的催化合成方法,普遍追求的目标是以高产率获取目标产物,即开发高活性的催化反应体系,以提高原子经济性,减少资源浪费和环境污染。然而,高活性催化反应体系的开发通常需要对催化剂和溶剂等多种反应条件进行详尽探索,这使得其成为一项时间和资源消耗极大的任务。目前,反应条件的筛选大多依赖于经验判断和偶然发现,使得催化反应条件的优化过程既费时又费力,这严重限制了新的高效催化合成策略的发展。

通过利用历史催化反应数据,并结合AI技术,以预测新催化反应的产率,从而有效地帮助科研人员和产业界加快高活性反应条件的筛选速度,减少资源与人力的消耗,促进新物质的创造与合成。
说人话就是:用AI来预测新催化反应的产率

我的一些想法:

我们基于现有的数据,从多个方向去推导,得到一个结果,这个结果应该和方向的个数以及每个方向的深度相关

猜测优化方向

决策树个数

这个他文件里面说了越多越好,但不能太多,也就是要卡极限,反正我也没有学过AI,决策树这个专有名词我也不知道什么意思,但是决策本义就有一定的思考之义,那么这个决策树能否可以理解为人的思考的过程呢?决策树的个数能否理解为从多个角度去思考,去预测呢?也就是决策树的个数是否可以理解为思考的广度

树的最大深度

结合上面的决策树的个数而谈,那么树的最大深度是否可以理解为思考的深度呢?

结合上面的思考,修改代码如下

model = RandomForestRegressor(n_estimators=25,max_depth=12,min_samples_split=2,min_samples_leaf=1,n_jobs=-1) # 实例化模型,并指定重要参数
model.fit(train_x,train_y) # 训练模型

一些其他的想法

由于这个一天只能提交三次,所以我今天的次数用完了

下面是其他的一些想法

  • train_x中有大量的0,能否直接生成?拼接比较耗时
    train_x = np.concatenate([train_rct1_fp, train_rct2_fp, train_add_fp, train_sol_fp], axis=1)
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值