目录
python里面包含定义好的数据结构以及很多库函数、方法、模型等(即API)。
我们只需要选择一个合适的框架,通过调用其中的API,编写少量代码就可以快速建立机器学习模型了。
一、机器学习中常用的库
pandas 和 numpy 提供数据结构,支持数学运算;
matplotlib和seaborn用于数据可视化;
4个库提供算法,其中scikit-learn是机器学习框架,tensorflow、keras和pytorch则是深度学习框架。
二、机器学习项目实战架构
(1)问题定义
(2)数据的收集和预处理
收集:有的是自有数据,有的需要去网上爬取,有时候去各种开源数据网站下载......
预处理:
可视化,从各种角度看一看数据&#x