数据挖掘笔记
南望山半仙
这个作者很懒,什么都没留下…
展开
-
数据挖掘学习笔记-简单的特征筛选模型(二)
数据挖掘学习笔记-简单的特征筛选模型(二)特征筛选的意义利用logistics进行特征筛选logistics模型简述logistics的模型应用L1与L2惩罚项利用XGBoost进行特征筛选相关系数热力图绘制注:1.在完成前一部分的数据预处理后,可以构建预测模型,这里简单运用了2个预测模型特征筛选。2.由于我闲了这么久重新学习python,算是重新复习数据挖掘的知识。3.这里用了相对简单好用的两个方法。想到通用性啥的,也方便他人借鉴,代码简化了下。特征筛选的意义 在一个二分类或者多分类问题中,对原创 2020-11-02 22:06:37 · 2886 阅读 · 0 评论 -
数据挖掘学习笔记-数据预处理部分(一)
数据挖掘笔记-数据预处理部分(一)数据预处理-年数据部分设置索引与标记异常值与缺失值处理股票行为标记归一化onehot特征编码数据预处理-日数据部分导入数据与标记缺失数据处理数据简化与使用方法参考数据简化季度数据的几个使用方法年-日数据的匹配后记与说明注:1.该笔记内容与数据来源于20年泰迪杯A题,以该题为例,此处仅涉及到到其年数据的预处理,工具为python3+jupyter。2.此处笔记的代码仅含比较通用的部分,即一部分个人认为比较重要的步骤的代码块儿。在实际做该题中需要考虑很多其他的因素与数据形原创 2020-10-31 16:03:50 · 1638 阅读 · 7 评论