基本概念和环境
matpotlib
numpy
pandas
为什么要进行数据分析的学习
有岗位需求
是python数据科学的基础
是机器学习课程的基础
什么是数据分析:
数据分析是适用的方法收集来大量数据时行分析
帮助人们作出判断,以便采取适当行动
数据分析的流程
提出问题-->准备数据-->分析数据-->获得结论-->成果可视化
-->辅助决策
Conda环境安装
conda:data science package & environment manager
创建环境
conda create --name python3 python=3
切换环境
windows:active python3
Liunx:source active python3
认识Jupyter notebook
jupyter notebook:一款编程、文档、笔记展示软件
启动jupyter notebook
环境安装
认识jupyter notebook
#coding=utf-8
__author__ = 'Administrator'
import requests
response = requests.get("http://www.baidu.com")
print(response.status_code)
print("----------------------------------------------------")
print(response.text.encode("utf-8"))
第二部分:matplotlib
为什么要学习matplotlib
能将数据进行可视化,更直观的呈现
使用数据更加客观,更具说明力
什么是matplotlib
matplotlib:最流行的python底层绘图库,主要给数据可视化图表,名字取材于matlab,仿真matlab构建
matplotlib: axis轴,指的x或y这种坐标轴
基本要点
每个红色的点是坐标,把5个点的坐连接成一条线,组成一个折线图
那么到底如何把它通过代码画出来呢?
通过下面的小例子我们来看一下matplotlib该如何简单的使用
假设一天中每隔两小时(range(2,26,2))的气温(摄氏度)分别是
【15,13,14,5,17,20,25,26,26,27,22,18,15】
matplotlib基本要点
matplotlib的散点图、直方图、柱状图
更多的图形工具
#coding=utf-8
__author__ = 'Administrator'
from matplotlib import pyplot as plt
#数据在x轴的位置,是一个可迭代的对象
x = range(2,26,2)
print(x)
for item in x:
print(item)
#数据在y轴的位置,是一个可迭代对象,x轴和y轴的数据一起组成了所有要绘制出的坐标
#分别是(2,15) (4,13) (6,14.5) (8,17)
y = [15,13,14.5,17,20,25,26,26,24,22,18,15]
plt.plot(x,y)
plt.show()
可以更多的设置
但是目前存在以下问题:
1、设置图片的大小(想要一个高清无码大图)
2、保存到本地
3、描述信息,比如x轴和y轴表示什么,这个图表示什么
4、调整x或者y的刻度的间距
5、线条的样条(比如颜色、透明色等)
6、标记出特殊的点(比如告诉别人最高点和最低点在哪里)
7、给图片添加一个水印(防伪,防止盗用)
调整x或y轴上的刻度
那么问题来了:
如果列表A表示10点到12点的每一分钟的气温,如何绘制折线图观察每分钟气温变化情况。
a=[random.randint(20,35) for i in range(20) ]
设置中文显示
为什么无法显示中文
matplotlib默认不支持中文字符,因为默认的英文显示汉字
查看
fc-list 查看支持的字体
fc-list :lang=zh 查看支持的中文(冒号前面有空格)
那么问题来了,如何修改matplotlib的默认字休?
#coding=utf-8
__author__ = 'Administrator'
from matplotlib import pyplot as plt
#figure 图形图标的意思,在这里指的就是我们画的衅
#通过实例化一个Figure并且传递参数,能够在后台自动使用该figure实例
#在图像模糊的时候可以传入dpi参数,让图片更加清晰
plt.figure(figsize=(20,8),dpi=80)
#数据在x轴的位置,是一个可迭代的对象
x = range(2,26,2)
print(x)
for item in x:
print(item)
#数据在y轴的位置,是一个可迭代对象,x轴和y轴的数据一起组成了所有要绘制出的坐标
#分别是(2,15) (4,13) (6,14.5) (8,17)
y = [15,13,14.5,17,20,25,26,26,24,22,18,15]
plt.plot(x,y)
#设置x轴的刻度
plt.xticks(x)
plt.yticks(y)
#plt.savefig('./sig_size.png')
plt.show()
实例示例:
假设在30岁的时候,根据自己的实例情况,统计出来了从11岁到30岁每年交的女(男)朋友的数量如列表a
请绘制出该数据的折线图,以便分析自已的交女(男)朋友的数量走势
a=[1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,2,1,1,1]
要求:
y轴表示个数
x轴表示岁数,比如11岁、12岁等
绘制散点图
假设通过爬虫获取到了北京2016年3,10月份每天白天的最高气温(分别位于列表a,b)那么此时如何寻找气浊
a=[11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]
b=[26,26,28,]