数据分析
Py.ziMing
来都来了,点个关注吧,亲
展开
-
Python数据分析——目录
Python数据分析目录这是整个数据分析系列的目录。如果打不开的,那就证明它只是个计划,我会尽快把它完善的。Python数据分析00——Ubuntu18.04安装Anaconda3Python数据分析01——Numpy模块学习Python数据分析02——Pandas模块学习(一)Python数据分析03——Pandas模块学习(二)Python数据分析04——Pandas模块学习...原创 2019-07-11 16:32:48 · 1412 阅读 · 0 评论 -
Python数据分析31——seaborn可视化(七)之网格
seaborn 绘制网格准备工作先导入相关模块和数据集。import numpy as npimport pandas as pdfrom pandas import Series, DataFrameimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inlinetips = sns.load_data...原创 2019-06-21 13:24:14 · 2466 阅读 · 0 评论 -
Python数据分析30——seaborn可视化(六)之回归图
seaborn 绘制回归图准备工作先导入相关模块和数据集。import numpy as npimport pandas as pdfrom pandas import Series, DataFrameimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inlinetips = sns.load_dat...原创 2019-06-21 13:15:48 · 4231 阅读 · 3 评论 -
Python数据分析18——公务员工资数据分析
巴尔的摩公务员数据分析数据准备由于我没有找到我们国家的公务员的工资数据,只能用《从零开始学Python数据分析》这本书提供的美国的巴尔的摩的公务员的工资数据。其实,你也可以直接在网上下载,巴尔的摩公务员数据查看数据情况先导入相关的包了打开我们下载好的数据集。import pandas as pdimport numpy as np%matplotlib inlinedata ...原创 2019-06-11 13:52:54 · 3360 阅读 · 1 评论 -
Python数据分析29——seaborn可视化(五)之琴形图
准备工作先导入相关模块和数据集。import numpy as npimport pandas as pdfrom pandas import Series, DataFrameimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inlinetips = sns.load_dataset('tips')t...原创 2019-06-16 14:10:49 · 4492 阅读 · 0 评论 -
Python数据分析28——seaborn可视化(四)之箱线图和分类柱状图
准备工作先导入相关模块和数据集。import numpy as npimport pandas as pdfrom pandas import Series, DataFrameimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inlinetips = sns.load_dataset('tips')t...原创 2019-06-16 13:43:40 · 8456 阅读 · 0 评论 -
Python数据分析27——seaborn可视化(三)之分类散点图
seaborn 绘制分类图准备工作在这一篇博客中,依旧使用seaborn模块自带的小费数据集来绘图。下面,先导入相关模块并生成小费数据集的DataFrame对象。import numpy as npimport pandas as pdfrom pandas import Series, DataFrameimport matplotlib.pyplot as pltimpor...原创 2019-06-16 13:30:53 · 8938 阅读 · 0 评论 -
Python数据分析17——seaborn小费数据集
消费数据集我之前也有用过seaboard中的小费数据集,但是没有对它进行详尽一点的分析。接下来,我就用小费数据集进行一些数据分析。准备工作导入相关的库。import pandas as pdimport numpy as npfrom pandas import Series, DataFrameimport seaborn as sns创建小费数据集对象。tips = s...原创 2019-06-10 17:34:14 · 5536 阅读 · 1 评论 -
Python数据分析26——seaborn可视化(二)之多变量分布图
seaborn绘制多变量图这里,沿用上一个博客的库和包,并且都是使用小费数据集。import numpy as npimport pandas as pdfrom pandas import Series, DataFrameimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inlinetips = ...原创 2019-06-15 21:54:11 · 6727 阅读 · 0 评论 -
Python数据分析32——pyecharts绘制交互式图表
pyecharts模块pycharts模块是百度开元的一个数据可视化JavaScnpt库。最重要的是:使用pyecharts绘制的图表美观且具有交互性。pyecharts安装使用PIP安装。pip install pycharts==0.5.11注意:pyecharts包在1.0版本之后就大版本更新了,现有的语法结构都变了。所以,安装的时候要留心版本。准备工作import py...原创 2019-06-21 20:31:38 · 3989 阅读 · 0 评论 -
Python数据分析19——matplotlib可视化(一)之线形图
matplotlib绘制线形图线形图是最基本的图表了,没有之一,所以这是我们必须掌握的技能。准备首先,我们必须先安装matplotlib模块。pip install matplotlib然后,我们在jupyter notebook中导入相关的模块和包。import numpy as npimport pandas as pdfrom pandas import Series,...原创 2019-06-12 13:44:19 · 7424 阅读 · 1 评论 -
Python数据分析40——Python绘制matplotlib三维图
Python绘制三维图声明:本文是转载的。原作者是 hitrjj,原博客地址是 Python三维绘图–Matplotlib 。1.创建三维坐标轴对象Axes3D创建Axes3D主要有两种方式,一种是利用关键字projection='3d’l来实现,另一种则是通过从mpl_toolkits.mplot3d导入对象Axes3D来实现,目的都是生成具有三维格式的对象Axes3D.#方法一...转载 2019-07-13 14:37:25 · 11349 阅读 · 0 评论 -
Python数据分析39——datetime模块(七)采样
频率转换与重采样重采样降采样升采样原创 2019-06-22 16:20:10 · 340 阅读 · 0 评论 -
Python数据分析38——datetime模块(六)之频率与时期数据转换
相关的准备工作可以查看之前的博客,直接看 下面的内容也不会出现问题。频率转换Period 和 PeriodIndex 对象可以通过asfreq() 函数进行转换。Period看看其他月份的转换。2. PeriodIndex时期数据转换利用to_period() 函数可以吧时间戳转换为时期。指定转换的频率。通过 to_timestamp() 函数可以把时...原创 2019-06-22 16:07:26 · 614 阅读 · 0 评论 -
Python数据分析37——datetime模块(五)之时期
时期时期基础频率转换时期数据转换频率转换与重采样重采样降采样升采样原创 2019-06-22 15:55:25 · 205 阅读 · 0 评论 -
Python数据分析36——datetime模块(四)之日期
日期接下来,会有日期的范围和频率与移动的内容。日期范围使用pandas模块的date.range() 函数可以创建指定 长度的datetimeindex索引。index = pd.date_range('2019/4/1', '2019/5/10')上面的两个参数是开始和结束Dev 时间,时间戳的间距默认是一天。这个肯定是可以改的——freq。下面演示用月作为间隔。index ...原创 2019-06-22 15:37:41 · 486 阅读 · 0 评论 -
Pytthon数据分析35——datetime模块(三)之时间序列
时间序列基础时间序列构造索引与切片日期日期范围频率与移动时期时期基础频率转换时期数据转换频率转换与重采样重采样降采样升采样原创 2019-06-22 14:57:49 · 286 阅读 · 0 评论 -
Python数据分析34——datetime模块(二)之时间类型转换
时间类型转换在进行数据分析时,我们难免会遇到一些字符型的时间戳,或者我们就是要转换成字符型的时间戳。所以,学会时间类型的转换就很有必要了。准备工作引入相关的模块。from datetime import datetime创建一个新的日期对象。stamp = datetime(2019,6,5)类型转换直接用str()函数就可以强制转换成字符型了。str(stamp)...原创 2019-06-22 13:49:10 · 257 阅读 · 0 评论 -
Python数据分析33——datetime模块(一)之构造时间数据类型
123原创 2019-06-22 12:07:11 · 2082 阅读 · 0 评论 -
Python数据分析25——seaborn可视化(二)之单变量分布图
seaboard绘制单变量分布图接下来,会用到seaborn模块中自带的小费数据集。import numpy as npimport pandas as pdfrom pandas import Series, DataFrameimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline导入小费...原创 2019-06-15 21:38:59 · 2568 阅读 · 0 评论 -
Python数据分析24——seaborn可视化(一)之seaborn样式
seaborn 可视化Seaborn 是一个基于 matplotlib 且数据结构与 pandas 统一的统计图制作库。你可以简单通过 pip 安装seaborn 。pip install seaborn在这里,我分享一个seaborn中文文档的链接,seaborn中文文档那里有大神们翻译的文档。我这里,主要分享seaborn中设定好的五种样式。样式五种样式分别是darkgri...原创 2019-06-15 21:12:55 · 1487 阅读 · 1 评论 -
Python数据分析16——numpy示例之图像变化
numpy模块可以用于图像的变换。接下来,我们来点恶搞的东西。话不多说,先来看小姐姐。下面来看看转换像素之后的照片。只需要简单的几行代码就可以实现了,下面我们来看看吧。首先来看看几个导入的包。from PIL import Imageimport numpy as np先用Image()的open()方法打开图片,再转为numpy数组。image = np.array(I...原创 2019-06-10 12:59:22 · 709 阅读 · 1 评论 -
Python数据分析09——数据清洗(三)
123原创 2019-06-02 00:45:28 · 290 阅读 · 0 评论 -
Python数据分析05——Pandas模块学习(四)
pandas可视化pandas总结原创 2019-05-29 13:43:29 · 311 阅读 · 0 评论 -
Python数据分析08——数据清洗(二)
利用函数或映射进行数据转换检测异常值虚拟变量原创 2019-05-31 20:49:58 · 368 阅读 · 0 评论 -
Python数据分析07——数据清洗(一)
处理缺失值移除重复数据利用函数或映射进行数据转换检测异常值虚拟变量原创 2019-05-31 20:26:18 · 464 阅读 · 0 评论 -
Python数据分析04——Pandas模块学习(三)
pandas数据运算pandas层次化索引pandas可视化pandas总结原创 2019-05-28 16:22:54 · 407 阅读 · 0 评论 -
Python数据分析03——Pandas模块学习(二)
写在前面:这一篇博文事紧跟着系列的上一篇博文的,由于篇幅的原因才放置在这一篇博文中。pandas数据运算pandas层次化索引pandas可视化pandas总结...原创 2019-05-27 20:58:43 · 1775 阅读 · 0 评论 -
Python数据分析06——读取和存储外部数据
CSV文件TXT文件JSON文件Excel文件数据库原创 2019-05-30 16:11:52 · 356 阅读 · 0 评论 -
Python数据分析02——Pandas模块学习(一)
写在前面,这一篇博文还是分享我用jupyter botebook学习的过程。由于pandas模块的内容比较多,而且很重要,我就分开了两篇博客来分享给大家。首先我们来看看我用到了哪些模块,以及模块里面的函数。pandas数据结构pandas索引...原创 2019-05-26 22:25:37 · 473 阅读 · 0 评论 -
Python数据分析10——数据清洗(四)
数据重塑字符串处理字符串方法正则表达式原创 2019-06-02 11:10:27 · 256 阅读 · 0 评论 -
Python数据分析11——数据清洗(五)
groupby按列名分组按字典分组按函数分组原创 2019-06-02 11:35:48 · 294 阅读 · 0 评论 -
Python数据分析23——matplotlib可视化(五)之自定义图表
matplotlib自定义图表matplotlib 模块是最基本的 Python 模块,在它上面还有更加高级的 API 封装库,比如 seaborn 模块和pyechart 模块。所以,matplotlib 模块可以轻松的完成自定义图表的设置。准备工作导入我们下面用到的相关的库和模块。import numpy as npimport pandas as pdfrom pandas ...原创 2019-06-14 19:38:35 · 839 阅读 · 0 评论 -
Python数据分析22——matplotlib可视化(四)之散点图与直方图
matplotlib绘制散点图那些导入的代码,我就不写上来了,你可以看我上一篇的博客跟之前所有的博客。使用 matplotlib 模块的 scatter() 函数可以绘制散点图。首先准备用于绘图的数据。X = np.random.randn(100)Y = np.random.randn(100)然后是绘制散点图的代码。plt.scatter(X, Y)更改颜色和标记更改...原创 2019-06-14 17:28:20 · 921 阅读 · 0 评论 -
Python数据分析21——matplotlib可视化(三)之真实数据绘制柱状图
matplotlib绘制柱状图我们这一篇博客先来看看在真实的数据中怎么绘制直方图。我的目标是要分别用男女性的 小费平均值绘制柱状图。准备我所说的真实的数据是seaborn模块中的小费数据集。首先,把数据导进来。import seaborn as snstips = sns.load_dataset('tips')tips.head()数据处理我是通过groupby()函数计...原创 2019-06-14 17:21:29 · 1907 阅读 · 0 评论 -
Python数据分析15——数据透视表
仍然使用小费数据集透视表这里,主要用到的是pivot_table()函数。value代表的是值 index 代表行,columns 代表列。上图是是默认计算平均值的,可以通过aggfunc()来指定。还可以加入分项小计。交叉表这里主要通过pandas模块的crosstab()参数建立交叉表。通过div参数,可以使每一行的和为1。最后,画个图就结束吧。...原创 2019-07-01 17:24:38 · 1353 阅读 · 5 评论 -
Python数据分析14——数据分组运算
注意:这篇博客仍然是使用seaborn中的小费数据集。分组运算transfrom方法我们要对小费数据集的男女性所给的小费求平均值,并它加在原数据中。下面就是普通方法:先聚合运算,再合并。但是使用transform()方法就不一样了。因为它可以运算到每一行。apply方法接下来,你可以更加深刻的体会到apply方法的强大。计算根据性别分组后小费金额的前五名。我们还可以...原创 2019-06-02 17:47:28 · 381 阅读 · 0 评论 -
Python数据分析13——数据聚合运算
分组运算transfrom方法apply方法数据透视表透视表交叉表原创 2019-06-02 17:26:30 · 516 阅读 · 0 评论 -
Python数据分析12——数据分组
聚合函数多函数应用一列多函数多列多函数不同列不同函数原创 2019-06-02 16:59:27 · 1116 阅读 · 0 评论 -
Python数据分析20——matplotlib可视化(二)之柱状图
matplotlib绘制柱状图柱状图(bar chart),是一种以长方形的长度为变量的表达图形的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况,用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。柱状图亦可横向排列,或用多维方式表达。准备import numpy as npimport pandas as pdfrom pandas...原创 2019-06-13 20:08:41 · 12648 阅读 · 17 评论