- 博客(5)
- 收藏
- 关注
原创 Datawhale pandas基础学习
第1章 Pandas基础基本数据结构1. Series(a)创建一个Series对于一个Series,其中最常用的属性为值(values),索引(index),名字(name),类型(dtype)s = pd.Series(np.random.randn(5),index=['a','b','c','d','e'],name='这是一个Series',dtype='float64')s...
2020-04-20 21:16:52
224
1
原创 Datawhale 零基础入门数据挖掘-Task5 模型融合
Datawhale 零基础入门数据挖掘-Task5 模型融合模型融合目标对于多种调参完成的模型进行模型融合。完成对于多种模型的融合,提交融合结果并打卡。内容介绍模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序...
2020-04-04 18:27:14
115
原创 Datawhale 零基础入门数据挖掘-Task4 建模调参
Datawhale 零基础入门数据挖掘-Task4 建模调参学习目标了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程内容介绍线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时间序列问题的验证;绘制学习率曲线;绘制验证曲线;嵌入式特征选择:Lasso回归;Ridge回归...
2020-04-01 21:36:57
94
原创 Datawhale 零基础入门数据挖掘-Task3特征工程
Datawhale 零基础入门数据挖掘-Task3特征工程一、特征工程目标对于特征进行进一步分析,并对于数据进行处理。完成对于特征工程的分析,并对于数据进行一些图表或者文字总结并打卡。二、内容介绍常见的特征工程包括:1.异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);2.长尾截断;特征归一化/标准化:标准化(转换为标准正态分布)...
2020-03-28 20:06:55
196
原创 Datawhale 零基础入门数据挖掘-Task2 数据分析
Datawhale 零基础入门数据挖掘-Task2 数据分析EDA-数据探索性分析编辑背景基于天池提供的数据挖掘实践,对二手车价格的预测。以下部分内容源自https://github.com/datawhalechina/team-learning/blob/master/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E5%AE%9E%E8%B7%B5%EF%B...
2020-03-24 20:33:09
401
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人