自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 时间序列预测-Time Series Forecasting Problem Search

这里是定义了一个初始化函数,因为Baseline模型只有Conv,这里面通过isinstance(m, nn.Conv2d)遍历上面定义的模型各个层结构(m代表当前层,nn.Conv2d代表2d卷积层)。stride: 卷积核下一次移动的步长(步长:假如数据shape为13*13,步长为1则代表每次卷积核移动一个数据的长度大小范围)初始化参数(m.weight代表当前卷积层卷积核的具体数值),跳过ReLU激活层。搭建完成,输入超参数(上面模型当中涉及到的变量,给定值的大小)

2024-07-30 21:09:13 559

原创 Datawhale Al夏令营-AI for Science(AI+药物)

train_data.csv:train_data.csv的每行为一条训练记录,包含数据记录的id、siRNA裸序列、相应的siRNA修饰序列、目标mRNA序列、siRNA浓度、细胞系、转染方法等实验室条件以及对应的实验室测量的mRNA Remaining值等总计19个字段。Remaining值一般位于0-100的区间内,100表示完全没有沉默效果,0表示该mRNA被彻底沉默,但是由于实验室测量的误差,可能存在少量训练记录的mRNA Remaining值在这个范围之外,这是正常的数据。

2024-07-28 17:08:23 803

原创 Datawhale Al夏令营-AI for Science

查看比赛数据发现:本次比赛数据量非常大,单个文件7G,对于传统预测而言无疑是难上加难。在部署的过程中需要大量的数量进行训练,契合海量数据的研究工作。首先,本次学习的主题是深度学习,与上期机器学习存在部分差异。以下为代码解析:(思路等明天重写)

2024-07-28 00:00:02 337

原创 Datawhale Al夏令营-A simple introduction of time series forecasting

时间序列预测是一个不断发展的领域,随着技术的进步,我们可以期待更多的优化方法和模型的出现。深度学习模型,特别是LSTM和其变体,已经在许多时间序列预测任务中显示出了优越的性能。更复杂的模型结构:如引入注意力机制的LSTM模型,以更好地捕捉时间序列中的长期依赖关系。多模态数据融合:结合时间序列数据和其他类型的数据,如文本或图像,以提供更全面的分析。模型解释性:提高模型的可解释性,以便更好地理解预测结果。自动化特征工程:开发自动化的特征工程工具,以减少手动特征提取的工作量。

2024-07-18 13:15:35 749

原创 特征工程-lightgbm

通过简单的数据查看(昨天那篇是分析不同房屋[id]在train.csv中的数据量发现可能存在数据不均衡的问题,今天的baseline是分析房屋类型[type]的均值。那么此时如果有一个新的数据点为3,我们可以认为该点为A类型(因为更靠近A,如果是B类型的话,偏差过大,没有其他特征参考很难令人信服)时序数据在预测的时候一定要注意时间顺序,如果你使用需要预测的时间天数的话,很有可能导致穿越问题(使用未来数据预测历史数据)。上篇提交的结果是用最近10天的数据均值作为预测结果,这次我们使用近似的思路:使用。

2024-07-17 22:14:52 243

原创 Datawhale_Machine_learning_Task1

简要描述分析电力赛题数据的一般操作(查看前几行、分析统计特征、查看是否存在类别不均的现象、检测数据集是否存在Null值等)

2024-07-15 22:58:57 207

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除