今天看到了一个叫做"机器学习100天"的教程,可以作为复习之用。
项目地址: https://github.com/Avik-Jain/100-Days-of-ML-Code-Chinese-Version
记录每天学习进度.
Day1: 数据预处理
第一步: 导入库
import numpy as np
import pandas as pd
第二步: 导入数据集
dataset = pd.read_csv('Data.csv')//读取csv文件
X = dataset.iloc[ : , :-1].values//.iloc[行,列]
Y = dataset.iloc[ : , 3].values // : 全部行 or 列;[a]第a行 or 列
// [a,b,c]第 a,b,c 行 or 列
第三步: 处理丢失数据
from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values = "NaN", strat