![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 92
powerlwj
这个作者很懒,什么都没留下…
展开
-
机器学习实例----美国人口收入分析
Sklearn–(1)原创不易,如需转载,请标明出处。 首先通过官网的图片简单了解Sklearn: 可以看到他的主要作用有:分类,回归,聚类,降维,模型选择,预处理。 今天我将利用Adult数据集进行演示。Adult 该数据从美国1994年人口普查数据库抽取而来,可以用来预测居民收入是否超过50k/year。该数据集类变量为年收入是否超过50k,属性变量包含年龄,工种,学历,职...原创 2018-03-23 14:18:08 · 8339 阅读 · 1 评论 -
机器学习中的特征处理--onehot编码
Sklearn–(2)首先介绍数据标准化工具onehot[独热编码]:One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。以手写数字识别为例,我们需要将0-9共十个数字标签转化成onehot标签。例如:数字标签“6”转化为onehot标签就是[0,0,0,0,0,0,1,0,0,0]. 我第一...原创 2018-04-25 20:12:48 · 2364 阅读 · 0 评论 -
Sklearn(3)
今天给大家带来的是商品预测案例: 文件描述:sales_train.csv - the training set. Daily historical data from January 2013 to October 2015.test.csv - the test set. You need to forecast the sales for these shops and prod...原创 2018-05-14 15:18:42 · 20251 阅读 · 0 评论 -
机器学习实例(2)
接上节: 接下来我们要做的工作是缕清楚数据集的各个特征的特点,针对不同的特征提出不同的处理方法:由于机器学习处理的都是都是数值信息,但是数据集有一部分是文本信息,这就需要对不同的文本信息进行不同的处理了。即下一步工作: 1. 特征的类别信息age:连续性数值变量;可能的处理方法:分年龄段;workcass: Private, Self-emp-not-inc, Self-emp-i...原创 2018-08-10 15:35:35 · 3887 阅读 · 4 评论 -
机器学习实例(3)
接上节机器学习实例2 上一节我们对所要处理的数据进行了分类(训练集和测试集),本节的主要目的是特征处理,关于数据集的特征信息我们已经在上一节详细介绍,这次直接进行处理:from sklearn.feature_extraction import DictVectorizerdict_vect=DictVectorizer(sparse=False)以上代码的目的:接着X_t...原创 2018-08-19 19:30:29 · 3072 阅读 · 3 评论