学习笔记
春风惹人醉
这个作者很懒,什么都没留下…
展开
-
学习笔记——Python处理netCDF文件
学习笔记——Python处理netCDF文件前言:在尝试一个数据竞赛时,需要处理nc文件,为此对相关资料整理记下如下笔记参考链接:https://zhuanlan.zhihu.com/p/100574643.nc(network Common Data Format)文件是气象上常用的数据格式,python上读取.nc使用较多的库为netCDF4这个库,下面将介绍这个库的具体方法。注意:filename文件路径和文件名中不能有中文!1.安装netCDF库pip install netCDF原创 2021-02-06 17:17:09 · 3575 阅读 · 0 评论 -
Sklearn——数据集分割
Sklearn——数据集分割通常,在训练有监督的机器学习模型的时候,会将数据划分为训练集**(Training set)、验证集(Validation set)和测试集(Test set)**,目的为了能够选出效果(可以理解为准确率)最好的、泛化能力最佳的模型。sklearn.model_selection.train_test_split 随机划分训练集和测试集train_test_split()函数是用来随机划分样本数据为训练集和测试集的,当然也可以人为的切片划分。优点:随机客观的划分数据,原创 2021-02-06 01:36:58 · 2265 阅读 · 0 评论 -
【听课笔记】数据挖掘竞赛——特征工程中的开发与技巧
【听课笔记】数据挖掘竞赛——特征工程中的开发与技巧写在前面有机会在老师的指引下听了下此次【课程:特征工程中的开发与技巧】。课程主要是由近期一场温室温度数据预测比赛的大佬,分享了他在这次比赛实战中取得优异成绩的方法与技巧。是非常好的学习资源,故在这里用博客的形式记录下课程内容。课程中这位老师首先简单介绍了时间序列预测任务 ,然后讲了特征工程的常见操作主要包括 数据清洗、特征构造和特征选择。最后老师分享了他在此次比赛中的一些上分技巧文末附有课件PPT及视频回访资源1. 时间预测任务简介时原创 2020-08-06 21:07:15 · 443 阅读 · 0 评论