一、生活中常见的图形
二、数据可视化基础知识
图中元素:对应英文单词要记住
视觉元素
1.数值类型:散点图(scatter plot)
2.时间序列:折线图(line plot)
3.分类数据:柱状图(bar plot)
4.颜色:热图(heatmap)
python绘图包matplotlib
使用plot绘制线条
第1个参数是x的坐标值,第2个参数是y的坐标值
color:线条颜色,值r表示红色(red)
marker:点的形状,值o表示点为圆圈标记(circle marker)
linestyle:线条的形状,值dashed表示用虚线连接各点
axis:坐标轴范围
语法为axis[xmin, xmax, ymin, ymax],
也就是axis[x轴最小值, x轴最大值, y轴最小值, y轴最大值]
如果matplotlib参入的参数只能是列表的话,这对数据处理很不利。一般,我们传入的是numpy的数组。实际上,所有参入的值内部都会转换为numpy的数组。
arange用于生成一个等差数组,最小值是零,最大值是五,公差0.2等差数列
使用数组同时绘制多个线性
运算符**,表示幂 - 返回x的y次幂,例如10**20表示10的20次方
在图上添加文本
多个图绘图
如何使用panda绘图
导入数据
阿里巴巴
每日股票价位信息
Open:开盘价
High:最高加
Low:最低价
Close:收盘价
Volume:成交量
下面我们主要关注每日的收盘价
定义字典
谷歌
亚马逊
苹果
腾讯
数据可视化
折线图:绘制股票走势
横轴x是股票时间,默认就可以了
纵轴y是收盘价Close这一列数据
plot默认是线条图
分析结果:通过图中显然可以看出阿里巴巴的股票价格总体趋势是增长的,是值得投资的一家公司。
散点图:成交量和股价
成交量:买入和卖出量的和
量价相同:价涨量升,价跌量缩(量指购买量,价指股价),成正线性相关。
量价背离:价涨量跌,市场低迷的前兆,成负线性相关。
我们给plot传入的横轴x坐标轴数据成交量这一列的数据,
纵轴y坐标轴数据是收盘价这一列的数据,1e7就是1乘以10的7次方
同时增加了一个参数叫kind这个值表示绘制图形的类型,这里的值等于scatter表示绘制散点图。
Volume(成交量)和Close(收盘价)交叉值0.335>0,呈正线性相关,表示成交量和股价变化方向相同,市场继续看好的表现。
GAFATA股价走势比较
因为谷歌和亚马逊的股价比较高,造成我们看不出其他4家公司的股票走势。 所以根据股价我们可以将这6家公司分成2组,一组是股价较高的谷歌和亚马逊。另外一组是股价较低的4家公司。
2018年谷歌和亚马逊累计涨幅
2018年4家公司股价走势比较
柱状图:六家公司股票的平均值
分析结果:可以看出,仅从股票价格上来判断,亚马逊和谷歌的股票价格要远远的超过了其他四家。但是这里只是算的平均值,下面我们看下用四分位数绘制的箱线图
用Jupyter notebook制作报告
markdown语法
notebook可以集合代码和文档,其中文档排版部分就是markdown语法实现的
# 一级标题
## 二级标题
示例如图:
无序列表和有序列表:
*无序列表
1.2.3.等用于有序列表
加粗和斜体:
**加粗内容**
*斜体内容*
示例如下:
超链接和图片
[网站名字](网址)
![图片名字](图片地址)
网址:
引用:
>引用,不包括空格
分割线
加3个*,按tab键换行
生成幻灯片
设置-view-Cell Tollbar-Slides Show
单元格菜单-Slide Type-Slide
隐藏菜单-view-Cell Tollbar-None
生成:
最后生成一个(html.)文件