大佬:Mosh Hamedani
本笔记按照Mosh Hamedani教程视频学习,供自己学习使用,如有雷同,概不负责。
八、机器学习 Machine Learning
步骤:
1、导入数据 Import the Data
通常以csv文件形式出现
2、处理/清理数据 Clean the Data
清理、整理重复数据,保证数据的准确性,否则影响机器学习,干扰输出
3、划分数据集 Split the Data into Traning/Test Sets
将数据集划分成学习集和测试集,如80%用于学习,20%用于测试
4、建立模型 Create a Model
5、训练模型 Train the Model
6、预测 Make Predictions
7、评估改善 Evaluate and Improve
本部分分为四个部分:
Numpy Pandas Matplotlib Scikit-learn
Jupyter
导入数据
注:若没有放入同一路径下,则需要输入完整路径
数据整体信息
注:Jupyter无需重复定义,第一行import pandas后,后面可直接使用
快捷方式
当这个框框为绿色时为编辑模式,
当这个框框为蓝色时为命令模式,按下esc键可变成蓝色
在蓝色框框时,按下"H”键,可出现快捷方式
ps: df. + tab可以快捷显示指令
df.describe + shift+ctrl 快速显示一些信息
ctrl + / 给一行注释,再按一次取消
在蓝色框框模式按两次D,可以删除此代码框
tab可以快速填充之前输入的变量名
A Real Problem
1、导入文件
2、分成两个状态集和结果集