- 博客(6)
- 收藏
- 关注
原创 时间序列预测-Time Series Forecasting Problem Search
这里是定义了一个初始化函数,因为Baseline模型只有Conv,这里面通过isinstance(m, nn.Conv2d)遍历上面定义的模型各个层结构(m代表当前层,nn.Conv2d代表2d卷积层)。stride: 卷积核下一次移动的步长(步长:假如数据shape为13*13,步长为1则代表每次卷积核移动一个数据的长度大小范围)初始化参数(m.weight代表当前卷积层卷积核的具体数值),跳过ReLU激活层。搭建完成,输入超参数(上面模型当中涉及到的变量,给定值的大小)
2024-07-30 21:09:13
559
原创 Datawhale Al夏令营-AI for Science(AI+药物)
train_data.csv:train_data.csv的每行为一条训练记录,包含数据记录的id、siRNA裸序列、相应的siRNA修饰序列、目标mRNA序列、siRNA浓度、细胞系、转染方法等实验室条件以及对应的实验室测量的mRNA Remaining值等总计19个字段。Remaining值一般位于0-100的区间内,100表示完全没有沉默效果,0表示该mRNA被彻底沉默,但是由于实验室测量的误差,可能存在少量训练记录的mRNA Remaining值在这个范围之外,这是正常的数据。
2024-07-28 17:08:23
803
原创 Datawhale Al夏令营-AI for Science
查看比赛数据发现:本次比赛数据量非常大,单个文件7G,对于传统预测而言无疑是难上加难。在部署的过程中需要大量的数量进行训练,契合海量数据的研究工作。首先,本次学习的主题是深度学习,与上期机器学习存在部分差异。以下为代码解析:(思路等明天重写)
2024-07-28 00:00:02
337
原创 Datawhale Al夏令营-A simple introduction of time series forecasting
时间序列预测是一个不断发展的领域,随着技术的进步,我们可以期待更多的优化方法和模型的出现。深度学习模型,特别是LSTM和其变体,已经在许多时间序列预测任务中显示出了优越的性能。更复杂的模型结构:如引入注意力机制的LSTM模型,以更好地捕捉时间序列中的长期依赖关系。多模态数据融合:结合时间序列数据和其他类型的数据,如文本或图像,以提供更全面的分析。模型解释性:提高模型的可解释性,以便更好地理解预测结果。自动化特征工程:开发自动化的特征工程工具,以减少手动特征提取的工作量。
2024-07-18 13:15:35
749
原创 特征工程-lightgbm
通过简单的数据查看(昨天那篇是分析不同房屋[id]在train.csv中的数据量发现可能存在数据不均衡的问题,今天的baseline是分析房屋类型[type]的均值。那么此时如果有一个新的数据点为3,我们可以认为该点为A类型(因为更靠近A,如果是B类型的话,偏差过大,没有其他特征参考很难令人信服)时序数据在预测的时候一定要注意时间顺序,如果你使用需要预测的时间天数的话,很有可能导致穿越问题(使用未来数据预测历史数据)。上篇提交的结果是用最近10天的数据均值作为预测结果,这次我们使用近似的思路:使用。
2024-07-17 22:14:52
243
原创 Datawhale_Machine_learning_Task1
简要描述分析电力赛题数据的一般操作(查看前几行、分析统计特征、查看是否存在类别不均的现象、检测数据集是否存在Null值等)
2024-07-15 22:58:57
207
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人