数据分析

基本概念和环境

matpotlib 

numpy 

pandas 

为什么要进行数据分析的学习

有岗位需求

是python数据科学的基础

是机器学习课程的基础

什么是数据分析:

数据分析是适用的方法收集来大量数据时行分析

帮助人们作出判断,以便采取适当行动

数据分析的流程

提出问题-->准备数据-->分析数据-->获得结论-->成果可视化

                                                                        -->辅助决策

Conda环境安装

conda:data science package & environment manager 

创建环境

conda create --name python3 python=3

切换环境

windows:active python3

Liunx:source active python3 

认识Jupyter notebook

jupyter notebook:一款编程、文档、笔记展示软件

启动jupyter notebook

环境安装

认识jupyter notebook

#coding=utf-8
__author__ = 'Administrator'

import requests
response = requests.get("http://www.baidu.com")
print(response.status_code)
print("----------------------------------------------------")
print(response.text.encode("utf-8"))

第二部分:matplotlib 

为什么要学习matplotlib 

能将数据进行可视化,更直观的呈现

使用数据更加客观,更具说明力

什么是matplotlib 

matplotlib:最流行的python底层绘图库,主要给数据可视化图表,名字取材于matlab,仿真matlab构建

matplotlib: axis轴,指的x或y这种坐标轴

基本要点

每个红色的点是坐标,把5个点的坐连接成一条线,组成一个折线图

那么到底如何把它通过代码画出来呢?

通过下面的小例子我们来看一下matplotlib该如何简单的使用

假设一天中每隔两小时(range(2,26,2))的气温(摄氏度)分别是

【15,13,14,5,17,20,25,26,26,27,22,18,15】

 

matplotlib基本要点

matplotlib的散点图、直方图、柱状图

更多的图形工具

#coding=utf-8
__author__ = 'Administrator'

from matplotlib import pyplot as plt
#数据在x轴的位置,是一个可迭代的对象
x = range(2,26,2)
print(x)
for item in x:
    print(item)
#数据在y轴的位置,是一个可迭代对象,x轴和y轴的数据一起组成了所有要绘制出的坐标
#分别是(2,15) (4,13) (6,14.5) (8,17)
y = [15,13,14.5,17,20,25,26,26,24,22,18,15]
plt.plot(x,y)
plt.show()

可以更多的设置

但是目前存在以下问题:

1、设置图片的大小(想要一个高清无码大图)

2、保存到本地

3、描述信息,比如x轴和y轴表示什么,这个图表示什么

4、调整x或者y的刻度的间距

5、线条的样条(比如颜色、透明色等)

6、标记出特殊的点(比如告诉别人最高点和最低点在哪里)

7、给图片添加一个水印(防伪,防止盗用)

调整x或y轴上的刻度

那么问题来了:

如果列表A表示10点到12点的每一分钟的气温,如何绘制折线图观察每分钟气温变化情况。

a=[random.randint(20,35) for i in range(20) ]

设置中文显示

为什么无法显示中文

matplotlib默认不支持中文字符,因为默认的英文显示汉字

查看

fc-list 查看支持的字体

 fc-list :lang=zh  查看支持的中文(冒号前面有空格)

那么问题来了,如何修改matplotlib的默认字休?

#coding=utf-8
__author__ = 'Administrator'

from matplotlib import pyplot as plt
#figure 图形图标的意思,在这里指的就是我们画的衅
#通过实例化一个Figure并且传递参数,能够在后台自动使用该figure实例
#在图像模糊的时候可以传入dpi参数,让图片更加清晰
plt.figure(figsize=(20,8),dpi=80)
#数据在x轴的位置,是一个可迭代的对象
x = range(2,26,2)
print(x)
for item in x:
    print(item)
#数据在y轴的位置,是一个可迭代对象,x轴和y轴的数据一起组成了所有要绘制出的坐标
#分别是(2,15) (4,13) (6,14.5) (8,17)
y = [15,13,14.5,17,20,25,26,26,24,22,18,15]
plt.plot(x,y)
#设置x轴的刻度
plt.xticks(x)
plt.yticks(y)
#plt.savefig('./sig_size.png')
plt.show()

实例示例:

假设在30岁的时候,根据自己的实例情况,统计出来了从11岁到30岁每年交的女(男)朋友的数量如列表a

请绘制出该数据的折线图,以便分析自已的交女(男)朋友的数量走势

a=[1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,2,1,1,1]

要求:

y轴表示个数

x轴表示岁数,比如11岁、12岁等

绘制散点图

假设通过爬虫获取到了北京2016年3,10月份每天白天的最高气温(分别位于列表a,b)那么此时如何寻找气浊

a=[11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]

b=[26,26,28,]

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值