数据可视化
文章平均质量分 93
pandas快捷绘图,matplotlib,seaborn,tableau,R 自写库快捷调用
萝 卜
这个作者很懒,什么都没留下…
展开
-
「流程案例」| 胡润富豪榜数据获取、分析与可视化
前言谁是中国首富?这是每年胡润富豪榜发出时大家最关心的话题。但只关注第一位就太未免浪费这份榜单的价值了,事实上这份榜单能挖掘到的信息很多,比如:哪些行业创造财富的能力最强这些大佬的年龄又集中在哪些区间哪些人资产进步最大本文将从数据获取、数据清洗、数据可视化入手,实现一整套完整的数据分析流程目标网站:https://www.hurun.net/zh-CN/Rank/HsRankDetails?pagetype=rich本文数据代码可以在公众号 “数据分析与商业实践” 后台回复「胡润」获原创 2021-11-26 12:02:59 · 2465 阅读 · 0 评论 -
不到 20 行 Python 代码,轻松玩转波士顿矩阵图!
代码简洁优雅,效果拔群!原创 2020-08-21 20:51:22 · 1711 阅读 · 0 评论 -
Python 绘制饼图时同时在每一块上显示数值和占比
能来到这篇文章的对 matplotlib 或者 seaborn 应该都挺熟的????所以直接上代码和效果图import matplotlib.pyplot as plt# make the pie circular by setting the aspect ratio to 1# plt.figure(figsize=plt.figaspect(1))values = [3, 12, 5, 8] labels = ['a', 'b', 'c', 'd'] def make_autopc原创 2020-08-07 11:14:11 · 11751 阅读 · 0 评论 -
Matplotlib 和 Seaborn 中文显示问题,绘图时数值的负号 ‘-‘ 为方块的问题,Jupyter Notebook 实现多行输出
直接上代码,亲测了两年半。import pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsplt.rc('font', **{'family': 'Microsoft YaHei, SimHei'}) # 设置中文字体的支持sns.set(font='SimHei') # 解决Seaborn中文显示问题,但会自动添加背景灰色网格plt.rcParams['axes.unicode_minus'] = False原创 2020-08-03 16:48:48 · 803 阅读 · 1 评论 -
箱线图类别排序可视化,类别排序(category)
本文已在公众号 “ 数据分析与商业实践 ” 首发???? 关注一下~,更多商业数据分析案例等你来撩效果先来看一下排序前后的效果,数据集为北京二手房房价,以增强箱型图(boxenplot)的形式来展示各地区的房价分布情况。能看出还是比较有细节感的,主要是重新对数据集中的各地区进行了排序,从而构建出一个内部顺序不一样但其余不变的数据集,再用TA进行绘图。实现流程数据预览直接绘图调整类别顺序其中,理解 .cat 与理解 .str 类似再次绘图一行代码实现树形图 treem原创 2020-06-22 11:40:13 · 1914 阅读 · 1 评论 -
快捷美丽的决策树可视化(无需安装 graphviz 与其他插件)
???? 关注一下~,更多商业数据分析案例等你来撩本文将专注于决策树的可视化过程,建模原理、结果分析和模型优化则会在未来的博文中呈现。P.S:决策树为客户流失预警项目的必会技能,相关数据源和超详细的代码解析可空降文末~~前言以下是笔者见过的对可视化初学者们最友好的概括:数据可视化是数据视觉表现形式的科学技术研究,主要是借助图形化的手段来清晰有效地传达与沟通信息。但这绝不意味着数据可视化必须为实现其功能而去深究枯燥的绘图代码,亦或是为了使图画看上去高端绚丽而显得过于复杂。需求决策树模型是解释性原创 2020-06-01 21:14:08 · 1262 阅读 · 4 评论 -
Python cufflinks 绘制折线图,时间序列,子图:简单,很快,很酷,还会动,从此 seaborn 是路人
引言 Python 的 seaborn 与 matplotlib 绘图已不必多说,相信能够开始尝试使用 cufflinks 或者 FineBI 等工具进行绘图的朋友,已经对基本的数据可视化有了一定的了解。那我们就直接开始吧,本博文用到的数据是通过 Selenium 网络爬虫从好买基金网上获取的,文末附有链接;且笔者也已经将常用的可视化图如 seaborn 中的 displot 正态曲线比较直...原创 2020-03-17 15:30:30 · 2482 阅读 · 0 评论 -
Python 绘制词云图:更改或自定义背景颜色,图片轮廓,图片大小等,根据词频生成(放入自写库,一行代码快速实现复杂绘图)
文章目录引言使用效果代码呈现延伸阅读后记引言 词云的作用已不必多说,也有许多不同版本生成词云的方法,但有时候调整图片细节能把人给调得脚趾头不自觉的瞉起。所以为何不直接将其封装进一个函数中,将各种绘制参数都事先准备好,尽可能一了百了呢?说干就干,看看下面的效果图就知道了。PS:Jupyter notebook 实现使用效果 使用前的注意事项:被读取的文本文件和希望自定义的图片轮廓需...原创 2020-02-26 21:15:05 · 11048 阅读 · 3 评论 -
Python 绘制正态曲线:linespace 组合 matplotlib(放入自写库,一行代码实现复杂绘图)
这是一个自写库系列,底部还有相关的骚操作快捷绘图的链接。不多说,已知 mu 和 sigma,一行代码实现复杂绘图,各种细节配置尽在不言中。PS:这个图的具体用法在下面这个链接统计学(一): Z 分数 & 正态分布 (附 Python 实现代码) --Z 检验先修; Z 分数与正态分布两者关系; Z 分数与百分位数的异同;面试要点(以心理学实验为舟) 夸张了吧,上面的这个破图...原创 2020-02-23 18:30:16 · 1317 阅读 · 0 评论 -
Python 数据可视化:Stack Graph 堆叠图,标准化堆叠柱形图,标准化的同时还能反应数据量大小的堆叠图(放入自写库,一行代码搞定复杂细节绘图)
这是一个自写库系列,即笔者在数据可视化路上踩过的坑的汇总,并自定义函数和传入参数来实现快速避坑 + 快速绘制出复杂精美的图片。引言 Python 的绘图功能非常强大,如果能将已有的绘图库和各种复杂操作汇总在一个自己写的库/包中,并实现一行代码就调用并实现复杂的绘图功能,那就更强大了。所以本博文只强调绘图代码的实现,绘图中的统计学知识(名义变量,数值变量,xx图与xx图的区别等等)与 ...原创 2020-02-17 17:52:03 · 1681 阅读 · 0 评论 -
Python 数据可视化:Matplotlib Heatmap 热力图,相关系数矩阵图(放入自写库,一行代码搞定复杂细节绘图)
这是一个自写库系列,即笔者在数据可视化路上踩过的坑的汇总,并自定义函数和传入参数来实现快速避坑 + 快速绘制出复杂精美的图片。引言 Python 的绘图功能非常强大,如果能将已有的绘图库和各种复杂操作汇总在一个自己写的库/包中,并实现一行代码就调用并实现复杂的绘图功能,那就更强大了。所以本博文只强调绘图代码的实现,绘图中的统计学知识(名义变量,数值变量,xx图与xx图的区别等等)与 ...原创 2020-02-17 13:24:31 · 6452 阅读 · 0 评论 -
Python 数据可视化:treemap 树形图 饼图升级版超详解,体现占比的同时显示出数量(放入自写库,一行代码搞定复杂细节绘图)
这是一个自写库系列,即笔者在数据可视化路上踩过的坑的汇总,并自定义函数和传入参数来实现快速避坑 + 快速绘制出复杂精美的图片。引言 Python 的绘图功能非常强大,如果能将已有的绘图库和各种复杂操作汇总在一个自己写的库/包中,并实现一行代码就调用并实现复杂的绘图功能,那就更强大了。所以本博文只强调绘图代码的实现,绘图中的统计学知识(名义变量,数值变量,xx图与xx图的区别等等)与 ...原创 2020-02-16 11:33:57 · 7002 阅读 · 4 评论 -
Python 数据可视化:seaborn displot 正态分布曲线拟合图代码注释超详解(放入自写库,一行代码搞定复杂细节绘图)
引言 Python 的绘图功能非常强大,如果能将已有的绘图库和各种复杂操作汇总在一个自己写的库/包中,并实现一行代码就调用并实现复杂的绘图功能,那就更强大了。所以本博文只强调绘图代码的实现,绘图中的统计学知识(名义变量,数值变量,xx图与xx图的区别等等)与 Python 基础库操作(seaborn,matplotlib)并不会提及,不过也欢迎关注,后续会有更多更广更丰富的知识疯狂输出。...原创 2020-02-15 20:19:04 · 7327 阅读 · 11 评论