机器学习实战
Wine Ray
这个作者很懒,什么都没留下…
展开
-
3.天池金融风控-贷款违约预测新人赛之特征工程
第三部分主要是对数据做特征工程,这也是影响数据挖掘模型好坏的非常重要的一步。我们的学习目标有:1.学习数据的预处理,包括特征的预处理、缺失值和异常值的处理、数据分桶等2. 学习特征交互、编码、选择的相应方法1.数据预处理第一步先导入我们需要的库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimefrom tqdm import tq原创 2020-09-21 13:08:55 · 2637 阅读 · 1 评论 -
机器学习实战之朴素贝叶斯
在学习了朴素贝叶斯理论之后,我们在这一部分将进行代码的实战,主要参考的材料也是《机器学习实战》这本书。1.使用朴素贝叶斯进行文档分类利用机器学习的知识对文档进行分类是一个很重要的应用。思路主要是将每个词出现或者不出现作为一个特征,这样特征数目就和词汇表中的数目一样多,在对其进行分析。朴素贝叶斯的一般过程:(1)收集数据:任何可收集到的方法。(这里用RSS源数据)(2)准备数据:数据类型要是数值或者布尔型(3)分析数据:大量特征时,绘制特征作用不大,直接用直方图效果更好(4)训练算法:计算不同的原创 2020-09-12 14:29:21 · 123 阅读 · 0 评论