机器学习
imp563875735
这个作者很懒,什么都没留下…
展开
-
数据预处理
1. Get the dataset 下载数据集2. Importing the Libraries 导入标准库3. Importing the Da原创 2017-12-19 05:04:18 · 247 阅读 · 0 评论 -
标准库导入
Pythonimport numpy #包含机器学习用到数学方法import matplotlib.pyplot #画图像import pandas #导入数据集,对数据集操作R直接在packages中缺什么下载什么就行了原创 2017-12-19 05:24:28 · 405 阅读 · 0 评论 -
导入数据集
在Spyder中设置好工作路径之后,利用pandas导入数据集dataset = pd.read_csv('Data.csv')运行之后就可以在Spyder旁边的Variable explorer中看到dataset的结果了然后需要创建包含自变量的矩阵和应变量的向量X = dataset.iloc[:, :-1].values iloc表示取数据集原创 2017-12-19 05:38:26 · 8475 阅读 · 0 评论 -
缺失数据处理
缺失数据意味着我们的数据集可能是不完整的,之前的例子中德国的缺了薪水,西班牙的缺了年龄。对于缺失的数据最简单的处理方法就是删除这两行数据,但是这样的话可能会遗失重要的信息,所以要采取一个更好的方法,最常用的方法就是,取这一列的平均值,或者是最常见的值来对缺失的数据进行补充。我们用工具来完成这个过程from sklearn.preprocessing import Imputer原创 2017-12-19 12:07:33 · 1135 阅读 · 0 评论