1、机器学习步骤
1、导入数据(csv、数据集)
2、清理数据(去除重复数据、去除不相关的数据)
3、分割数据集-》训练集和测试集(7:3)
4、创建模型
5、训练模型
6、做出预测
7、评估和提升(根据结果微调模型)
2、常用库
Numpy、Pandas、MatPlotLib、Scikit-Learn
3、jupyter notebook
查看数据十分方便
cmd -- jupyter notebook
会进入用户主目录--New--NoteBook--修改notebook的名称
默认是cmd所在路径
在jupyter中,以块为单位运行,python文件以整个文件作为一个块运行
绿色--编辑模式
蓝色--命令行模式 命令行模式按h显示所有的快捷键
命令行模式常用:
上插单元格 A
下插单元格 B
隐藏某一行的输出 O
DD删除某一行
编辑模式:
ctrl + enter 执行该行代码
alt + enter 执行并换行
shift + enter 切换到下一行
其他:
Cell--RunAll 运行所有行的代码
.后按tab会有提示
shift+tab会有帮助文档
3、pytorch总结
1、记载数据
两个类:Dataset和Dataloader
Dataset提供一种方式去获取数据及其label,告诉我们总共有多少个数据
Dataloader可以对数据进行一种打包,为网络提供不同的数据形式