机器学习一:数据预处理
最近一直在学习机器学习的知识,入门很难。之前跟着吴恩达老师的视频在学习,发现还是有很多的知识点难以理解。前不久,《机器学习A-Z》出了中文翻译,老师讲的非常浅显易懂,所以开始跟着学起来了。
为了能更系统的整理到学的知识进行一个整理,也作为一个自我监督,接下来就把较为系统的知识点都整理到博客上。相应的代码也会同步到github上。
下面所有的代码都是使用Python写的,数据预处理主要用到的是sklearn.preprocessing模块 [sklearn.apachecn.org/cn/0.19.0/m…]
目录
在机器学习一的这部分,我主要说一下数据的预处理。
1.导入标准库
- numpy:包含很多机器学习需要用到的数学方法
- matplotlib.pyplot:主要用于绘图
- pandas:导入数据集以及对数据集进行一系列的处理
import numpy as npimport matplotlib.pyplot as plt import pandas as pd复制代码
2.导入数据集
iloc数组中参数:逗号左边表示行数,逗号右边表示列数,冒号表示选择所有行或者列
# Import the datasetdatase