一图胜千言
量化祛魅师
不过是个概率游戏。清华老Q告诉你,量化远没你想的那么复杂!
展开
-
从零开始学matplotlib画图(一): 极速上手
文章目录1. plot()2. scatter()3. xlim() / ylim()4. xlabel() / ylabel()5. grid()6. axhline() / axvline()7. axhspan() / axvspan()8. annotate()9. text()10. title()11. legend()10. title()首先,不能马上让人上手的教程,就是耍流氓。...原创 2018-10-12 00:38:27 · 3173 阅读 · 4 评论 -
一天一图学Python可视化(1):线性回归图
现代人的时间越来越碎片化,因此我们准备抛弃那种长篇大论的教程,希望大家每天花上几分钟就可以学到一个小窍门或者某种图的绘制方法。只要每天都认真看一遍文章,有时间的时候花几分钟练习一下,一段时间之后,相信大家就都成为Python可视化的高手啦!接下来,我们目标不大,一天学习并掌握一个实用的小案例就够了!回归图今天,我们学习的是使用seaborn绘制回归图。回归图主要用于表现两个变量之间的线性关...原创 2018-12-25 14:16:28 · 15700 阅读 · 0 评论 -
Seaborn中文教程(一):可视化变量间的关系
众所周知,Seaborn“可能”是Python下最友好、易用的可视化工具了,可视化效果也非常好。但是截止目前,并没有一份中文教程供广大国内Python使用者查阅学习。怎么能因为语言的问题,让大家错过这么好用的一个可视化工具呢?思考再三,我决定花一些时间将官方的英文文档整理出来,为大家提供一份最权威的中文教程。考虑到我的时间比较碎片化,这项工作可能会在未来的几周内完成,感兴趣的朋友可以先关注和收藏...原创 2018-12-19 12:25:55 · 3028 阅读 · 2 评论 -
Seaborn中文教程(六):让图形更美观
让图形充满魅力是非常重要的。当我们探索一个数据集并且要进行可视化,那么,把图画得令人愉悦终究是不错的。可视化,是与听众交流大量信息时的核心方法,在这种情况下,让图形变得能瞬间抓住听众的注意非常有必要。matplotlib支持高度的自定义,但是我们很难弄清楚应该如何调整才能让图片更具吸引力。Seaborn提供了一系列定制好的主题和一个更高级的接口,用于调整基于matplotlib的图形的外观。i...原创 2018-12-23 02:38:16 · 1050 阅读 · 0 评论 -
Seaborn中文教程(四):线性关系的展示
许多数据集含有多个定量变量(数值型变量),而我们分析的目的往往是将他们关联起来。我们曾讨论过通过两个变量的联合分布来实现这一点。然而,使用统计模型来为两组带有噪声数据的观测值评估出一个简单的关系可以是非常有用的。这一章节我们讨论的函数将会在线性回归的框架下实现这种预测。seaborn中的回归图主要是为了在EDA(探索数据分析)阶段为发掘数据中存在的规律提供一些视觉指引,也就是说,seaborn本...原创 2018-12-21 18:46:22 · 974 阅读 · 0 评论 -
Seaborn中文教程(五):通过“多图网格”结构化展示多维数据
当探索具有中等数量(不多不少的意思……)维度的数据集时,一个很好的方式是基于不同的子数据集构建不同的实例,并将它们以网格的方式组织在一张图之中。这种技术有时被称为“lattice”或“trellis”(大概是格子图、网格图),这跟“small multiples”的概念类似(多张更小的子图)。它能帮助我们快速从复杂的数据中提取大量信息。matplotlib对于创建带有多个坐标轴(每个坐标轴体系意味...原创 2018-12-21 18:45:01 · 5583 阅读 · 0 评论 -
Seaborn中文教程(三):数据集的分布
当我们上手一个数据集时,往往第一件事就是了解每个变量是如何分布的。这一章节会简单地教大家如何在seaborn中检验一元分布和二元(维)分布。你也许会对如何对比一个变量在其他变量的不同水平下的分布有什么差异,在分类数据可视化教程中,你可以找到答案。import numpy as npimport pandas as pdimport seaborn as snsimport matplotl...原创 2018-12-20 16:23:32 · 3168 阅读 · 0 评论 -
Seaborn中文教程(二):分类数据可视化
在统计关系可视化教程中,我们学会了使用多种不同的方式来展示一个数据集中多个变量之间的关系。在一系列的例子中,我们聚焦于那些关系主要存在于两个数值型变量之间的情况。然而当其中一个变量是分类(离散)变量时,我们不妨使用更加有针对性的可视化方法。在seaborn中,有多种不同的方式来展示包含了分类数据的变量关系。正如relplot()和scatterplot()/lineplot()之间的关系一样,我...原创 2018-12-19 20:19:00 · 4064 阅读 · 0 评论 -
完美解决matplotlib画图中文显示问题
相信有很多人曾经被matplotlib画图的中文显示问题所困扰,包括我自己。每次生产环境发生改变,都会遭遇到这个问题,然后需要花大量的时间在它上边。最可气的是每次遇到的问题不一定一样,上一次使用的方法不一定适用。网上的教程很多,但没有看到一个完整的、必杀的解决方案。我在花了大量时间进行多次尝试之后,总结出了一套流程,截止目前我遇到过的所有的不同环境下(Linux + Mac)的matplotli...原创 2018-11-30 15:17:10 · 4099 阅读 · 0 评论 -
从零开始学matplotlib画图(五): 饼图及环形图
我们之前已经接触过了饼图,它主要用于表现比例、份额类的数据,今天我们在样式上进行更多的探索。我们以笔记本行业来作为例子。假设笔记本电脑行业有ABCD五家公司,他们在2017年的国内市场份额分别为45%、25%、15%、5%,其他公司10%。一、分裂饼图首先,我们可以将我们关注的分类单独分裂出来,达到突出显示的目的。假如我们在B公司里,我们想要将自家公司的数据单独拆出来:import mat...原创 2018-10-21 01:42:34 · 3631 阅读 · 0 评论 -
从零开始学matplotlib画图(六): 双轴图
在工作中,我们经常会遇到需要同时展示两种指标的需求。如果想要简单地实现这样的需求,我们完全可以将两个指标在两张图中展示。然而我们常常需要将两个极为相关或者同样重要的指标放在一起来观察,比如说,有一家内容类公司,需要观察过去一年产品日活以及内容整体点击率的趋势,他们既不想日活增长点击率降低,更不想单纯地提高点击率但用户却负增长。这种情况下,我们希望将日活(DAU)和点击率(CTR)放在一起来对比展...原创 2018-10-22 20:09:24 · 5757 阅读 · 0 评论 -
从零开始学matplotlib画图(三): 堆积图
堆积图常用于综合展示不同分类的指标趋势以及它们的总和的趋势。比如说,我们想看一下过去二十年来中国人口总量的变化趋势,同时,我们又想看一下男、女性人口各自的变化趋势,甚至我们还想看一下它们各自占比的变化趋势,这时,我们就可以用堆积图来更高效、更简洁地展示出来。####################################################################...原创 2018-10-16 21:07:12 · 7664 阅读 · 6 评论 -
从零开始学matplotlib画图(二): 统计图形入门
文章目录1. 柱状图(条形图) —— bar() / barh()2. 直方图 —— hist()3. 饼图 —— pie()4. 极线图 —— polar()5. 散点图 —— scatter()6. 杆图 —— stem()7. 箱线图 —— boxplot()8. 误差棒图 —— errorbar()折线图和散点图常用且实用,但是并不能满足我们的作图需求。这次我们会尝试更多常见的统计图形...原创 2018-10-16 03:19:27 · 1459 阅读 · 0 评论 -
从零开始学matplotlib画图(四): 并列柱状图
堆积柱状图有堆积柱状图的好处,比如说我们可以很方便地看到多分类总和的趋势。但是我们发现,在堆积柱状图中,由于基底位置的不同,我们并不能很轻易地弄清楚上方分类的数据的变化趋势。因此当分类不是特别多,且我们对于总量趋势的重视程度不如各分类的时候,我们就可以考虑使用并列柱状图,这也是一种非常常见的图形。跟上次一样,我们拿小明20次月考的语数外三门科目的成绩来演示并列柱状图。import matp...原创 2018-10-17 23:35:21 · 6280 阅读 · 0 评论 -
一天一图学Python可视化(2):让条形图更高级
温故知新:在昨天,我们学习了使用seaborn.lmplot()来绘制回归图,用来表示变量之间的线性关系。它主要是在散点图的基础上,绘制了一条直线,而这条直线(也可以是曲线)则表明了模型预测的变量之间的关系。忘记的同学可以回去再看一遍。今天,我们的目标是从一个小案例中学习以下几点:调色板条形图图形矩阵(多子图)条形图矩阵老规矩,我们先看代码和效果,然后再详解每一个细节。imp...原创 2018-12-26 11:04:55 · 2420 阅读 · 0 评论