自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 python可视化(5-1)高级接口(pandas相关接口)

聊一下数据马云说:“我们是通过卖东西收集数据,数据是阿里最值钱的财富。”他重新定义阿里并说阿里集团本质上是一家扩大数据价值的公司,同时他提到计算是生产力,互联网是生产关系,如果未来不运用数据,可能要比不用电更加可怕,未来计算的能力和数据就像今天的石油和电一样。可视化作为数据挖掘/展示的一个方向,已经有了很长时间的发展,在论述问题方面,“字不如表,表不如图”的理念已在各行各业获得认可,但归根至底,他的土壤还是数据。所以有必要在正文开始前,花一定的时间讨论下。数据库从数据库的角度看,目前存储数据的两种主要

2020-09-23 19:57:07 906

原创 python可视化(案例)高颜值图的复现(学术论文、商业周刊)

前文的两个案例虽用的都是虚拟数据集,但都有一定的针对性,案例 水果分类(香蕉、苹果大战) 中,讨论了一个分类问题,并对散点图、直方图、箱线图和等比例子图的应用做了探讨;案例 多元线性回归 中,讨论了一个回归问题,并对散点图能最大限度可视化数据的维度做了探讨;以上案例涉及算法的部分,如有难度,可自行忽略,因为本系列主要是针对可视化的,案例的目的是为了赋予一个场景,方面对可视化内容的直观理解。本文通过复现1张学术论文图及3张商业周刊图,加深对面积图、折线图、填充图等绘图对象及不等比例子图、栅格子图合并内容的理

2020-09-21 01:09:23 2430 3

原创 python可视化(案例)多元线性回归(车身光泽与油漆的关系、如何提升维度)

前文案例探讨了分类问题的聚类算法及可视化过程 水果分类(香蕉、苹果大战), 本文通过油漆混合的虚拟数据集讨论一个多元线性回归问题的可视化。文章目录多元线性回归-梯度下降定义函数-计算前向传播的值定义函数-计算权值(weights)的梯度定义函数-训练权值构造数据集开始训练源数据的映射可视化训练过程中的一步可视化N步多元线性回归-解析解解析解的效率机器学习sklearn增加特征数构建3个特征的数据集证明可视化N步解析解sklearn检查本文的运行环境为 jupyter notebookpython版本为

2020-09-18 11:48:13 3065

原创 python可视化(案例)水果分类(香蕉、苹果大战)

本文通过一个虚拟的数据集,对之前的内容做一个回顾。本文涉及的绘图对象详见:散点图绘制传送门条形图、直方图绘制传送门箱线图绘制传送门文末多子图、分类边界的绘制详见:子图绘制传送门等高面图绘制传送门文章目录构造数据集数据分布图散点图带误差棒的条形图箱线图直方图联合分布直方图特征生成与选择长宽比面积周长显著性检验聚类算法训练过程可视化定义函数-计算距离定义函数-训练簇心定义函数预测分类开始训练绘制某一步的簇心及预测边界绘制训练过程的簇心及分类边界本文的运行环境为 jupyter notebook

2020-09-16 22:08:13 7878 3

原创 python可视化(4)色板(mpl.colors, colormap, plt.cm, palette)

Excel中,颜色是通过界面展示及按钮选择确定的,在python代码环境下,自然是没有这种条件的,那么,matplotlib中颜色是如何构建与使用的呢?matplotlib提供了强大的颜色接口,供使用者定制颜色、使用颜色、使用色板,主要包括以下几个部分:1、 matplotlib.colors 接口中定义的颜色空间,每一个颜色通过字典的形式进行保存,字典名为颜色名称,字典值为颜色对应的RGB元组或十六进制字符串。例如颜色名称可以为 darkred,字典值为 #8B0000。凡是颜色命名空间中定义了的颜色

2020-09-15 17:39:44 28439 4

原创 python可视化(3-2)面向对象绘图(子图和他的小伙伴们,ax & ticks,label,legend,grid...)

我们进入:面向对象绘图 第二节本系列第二部分我们详细介绍了各绘图对象;本系列第三部分第一节详细介绍了fig与ax本文为面向对象绘图的收尾,将详细介绍子图ax及与子图相关的各个元素如:坐标轴、坐标轴刻度、图例、轴标题、网格线等。对象常用代号画布fig子图(或者坐标系)ax绘图对象(如散点,直方、折线等)ax.scatter、ax.hist、ax.plot坐标轴ax.xaxis坐标轴刻度ax.xaxis.xtick图例ax.legend

2020-09-14 18:27:58 1620

原创 python可视化(3-1)面向对象绘图(画布和子图,fig & ax)

我们进入下一个阶段:面向对象绘图matplotlib的前身是matlab,事实上,前两章的模块调用与matlab并无差异,无非就是将matlab语法换成python语法。遵循的仍然是顺序调用,接口传参,而后得到绘图结果的过程。而这是远远不够的,举个简单的例子,当我们得到绘图对象后,我们可能对绘图对象的横坐标尺度不够满意,比如原横坐标是每个0.1产生一个刻度,而我们需要每隔0.5产生一个尺度;有时,我们对图例是不够满意的,原图例是5行1列,而我们想将其设置为1行5列。解决这些问题,需要的是面向对象的思路,

2020-09-13 20:46:20 3448 2

原创 python可视化(2-3)绘图对象(箱线图、饼图、文字和箭头)

本文主要介绍箱线图、饼图、文字标记 和 箭头标记涉及的接口分别为 plt.boxplot、plt.pie、plt.text、plt.arrow本文的运行环境为 jupyter notebookpython版本为3.7本文所用到的库包括%matplotlib inlineimport numpy as npimport matplotlib.pyplot as plt箱线图直方图和箱线图是用以描述随机变量分布最重要的两类图,他们各有特色。本系列2.1部分对直方图已有了较为详细的介绍,今天着

2020-09-13 01:01:30 1702

原创 python可视化(2-2)绘图对象(折线图、散点图、面积图、填充图)

本文主要介绍折线图、散点图、面积图和填充图plt.plot是matplotlib最基础的接口,matplotlib作者也将这个接口设计得足够简单,以至于只需要输入一个参数(数组,列表型数据),就能够绘制好一张图。与此同时,由于折线图(plt.plot)和散点图(plt.scatter)都可以对数据点进行不同形状的标记,使用起来容易将其混淆,因此本文将这两类绘图对象放在一起介绍,方便读者进行对比。最后,将表现趋势的面积图和填充图也一并放在本文。本文的运行环境为 jupyter notebookpyt

2020-09-12 00:31:39 4602

原创 python可视化(2-1)绘图对象(条形图、直方图、柏拉图)

刚上班那会,从室友那里不经意拿到一本刘万祥老师的《Excel图表之道》,相信有很多读者也都阅读过那本书,作为可视化领域鼻祖类的书籍,该书给了我不少体会:体会一:图表应该是不需要解释的,或者说是自我解释的,所谓“一图抵千言”体会二:看起来好看的图表都是很多元素堆积起来的,在没有使用代码的情况下,刘万祥老师巧妙地通过表格、图像元素,“重现出”经济学人等杂志的图,实属不易。体会三:根据数据类型及数据关系,寻找到恰当的绘图对象,是说好故事的关键Excel是很出色的工具,不需要编写代码,带有按钮的界面也很有亲

2020-09-09 00:48:55 2189

原创 python可视化(1)从一张图开始入门

Life is short,show me the code !人生苦短,python的套路不可谓不深……当你开开心心地攻破python基础语法并牛刀小试地学会numpy,pandas的时候,新的空间已经为你打开!沿着可视化方向,可以精进matplotlib、seaborn等可视化库;沿着人工智能方向,可以精进机器学习(sklearn)、深度学习(tensorflow,keras,pytorch)等库;沿着爬虫方向,可以精进beautifulsoup,selenium,scrapy,flask等库

2020-09-07 22:45:52 436 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除