Python数据可视化
数据可视化--专注、执着
小松悦读会 | kevinelstri
小松悦读会,用心阅读,执着专注!
展开
-
Python数据可视化:中心极限定律
中心极限定理是研究独立随机变量和的极限分布为正态分布的问题。设随机变量序列 相互独立,均具有相同的数学期望与方差,即 令: 则称随机变量为随机变量序列的规范和。中心极限定理:设从均值为、方差为;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为 的正态分布。【定理1】:(独立同分布的中心极限定理) 设随机变量 相互独立,具有相同的分布, 记:原创 2016-09-27 14:18:51 · 4638 阅读 · 0 评论 -
Python数据可视化:泊松分布
一个服从泊松分布的随机变量X,表示在具有比率参数(rate parameter)λ的一段固定时间间隔内,事件发生的次数。参数λ告诉你该事件发生的比率。随机变量X的平均值和方差都是λ。 代码实现: # Poisson分布 x = np.random.poisson(lam=5, size=10000) # lam为λ size为k pillar = 15 a = pl原创 2016-09-27 15:29:14 · 29963 阅读 · 4 评论 -
Python数据可视化:饼状图
使用python实现论文里面的饼状图:原图: python代码实现: # # 饼状图 # plot.figure(figsize=(8,8)) labels = [u'Canteen', u'Supermarket', u'Dorm', u'Others'] sizes = [73, 21, 4, 2] colors = ['red', 'yellow', '原创 2016-09-27 23:12:45 · 52106 阅读 · 7 评论 -
Python数据可视化:幂律分布
1、公式推导 对幂律分布公式: 对公式两边同时取以10为底的对数: 令,且为常数,所以公式变为: 所以对于幂律公式,对X,Y取对数后,在坐标轴上为线性方程。2、可视化 从图形上来说,幂律分布及其拟合效果: 对X轴与Y轴取以10为底的对数。效果上就是X轴上1与10,与10与100的距离是一样的。 对XY取双对数后,坐标轴上点可以很好用直线拟合。所以,判定数据是否符合幂律分原创 2016-09-27 23:28:12 · 25352 阅读 · 8 评论 -
Python数据可视化:箱线图
一、箱线图概念 箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。 计算过程: (1)计算上四分位数(Q3),中位数,下四分位数(Q1) (2)计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range)Q3-Q1 (3)绘制箱线图的上下范围,上限为上四分位数,下原创 2016-10-26 19:01:39 · 46504 阅读 · 1 评论 -
Python数据可视化:Matplotlib 直方图、箱线图、条形图、热图、折线图、散点图。。。
介绍 使用Python进行数据分析,数据的可视化是数据分析结果最好的展示方式,这里从Analytic Vidhya中找到的相关数据,进行一系列图形的展示,从中得到更多的经验。 强烈推荐:Analytic VidhyaPython数据可视化库Matplotlib:其能够支持所有的2D作图和部分3D作图。能通过交互环境做出印刷质量的图像。Seaborn:基于Matplotli原创 2016-10-26 21:43:11 · 83694 阅读 · 11 评论 -
Python数据可视化:顶级绘图库plotly
https://plot.ly/python/static-image-export/plotly是现代平台的敏捷商业智能和数据科学库,它作为一款开源的绘图库,可以应用于Python、R、MATLAB、Excel、JavaScript和jupyter等多种语言,主要使用的js进行图形绘制,实现过程中主要就是调用plotly的函数接口,底层实现完全被隐藏,便于初学者的掌握。下面原创 2016-11-01 21:09:05 · 33280 阅读 · 5 评论 -
Python数据可视化:WordCloud词云的构建
在Python中构建词云,采用的是wordcloud库 官网: https://amueller.github.io/word_cloud/ github: https://github.com/amueller/word_cloud 下面对词云的构建进行代码实现:# -*- coding:utf-8 -*-from os import pathfrom scipy.misc import原创 2016-11-12 20:23:13 · 3723 阅读 · 0 评论 -
Python数据可视化:正态分布(高斯分布)
正态分布(Normal distribution)又成为高斯分布(Gaussian distribution)若随机变量X服从一个数学期望为、标准方差为的高斯分布,记为: 则其概率密度函数为: 正态分布的期望值决定了其位置,其标准差决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是的正态分布: 概率密度函数 代码实现: # Python实现原创 2016-09-27 11:19:31 · 53158 阅读 · 2 评论