机器学习流程 数据准备 1.导入自己的数据并爬取网上可能与预测目标相关的数据构建数据集 2.查看数据结构并判断是回归问题还是分类问题 df.head()#查看前5行 df['a'].value_counts()#查看分类 df.describe()#查看描述统计 还有运用matplotlib.pyplot画图查看属性 3.数据集拆分 取出一部分数据作为测试集(运用最常用的sklearn库),防止数据窥探偏误。