机器学习一百天中文版地址
https://github.com/MLEveryday/100-Days-Of-ML-Code
机器学习一百天英文版地址
https://github.com/Avik-Jain/100-Days-Of-ML-Code
本章是第一天内容的笔记,作记录学习之用
第一天的内容——数据预处理
第一步:导入需要的库 NumPy和Pandas
NumPy:包含数学计算函数
Pandas:用于导入和管理数据集
#导入库
import numpy as np
import pandas as pd
第二步是导入数据集
数据集的格式通常为**.csv**。csv是以文本形式保存表格数据,在电脑中可以用Excel软件打开。在代码中使用Pandas中的read_csv
方法读取本地文件
#导入数据集
dataset = pd.read_csv('Data.csv')#读取csv文件
X = dataset.iloc[:,:-1].values #.iloc[行,列] 选取[-1,0]
Y = dataset.iloc[:,3].values #:表示全部行或者列,[a]表示第a行或者列
#Pandas 读取文件时候,注意文件的存储路径不能带有中文,否则读取可能出错。
#.ilo