要明确:数据分析是机器学习的基础
认识一下 jupyter notebook 这个工具
jupyter notebook: 一款编程/文档/笔记/展示软件
启动命令:jupyter notebook
现在学习的思路是:用爬虫爬取数据,再用python数据分析,然后就是机器学习
数据分析有四块:
1、基础概念和环境
2、matplotlib -------- 画图
3、numpy -------- 解锁
4、pandas -------- 数据分析
matplotlib作用:
能将数据进行可视化,更直观的呈现
使数据更加客观、更具说服力
matplotlib: 最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建
# 设置图的大小和分辨率
plt.figure(figsize=(20,8),dpi=80)
figure指我们画的图
传入dip参数,让图像更加清晰
dpi(dots per inch):每英寸点数