![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 84
G-无忧仙-LB
无忧一世,快了一世!
展开
-
Pandas总结
Pandas总结 一、pandas中的DataFrame函数以及对象 下面介绍 DataFrame 的基本功能:(其中,df 为任意 DataFrame) df.values: 返回 ndarray 类型的对象 df.index: 获取行索引 df.columns: 获取列索引 ...原创 2021-01-14 10:26:55 · 727 阅读 · 0 评论 -
单变量、多变量分析绘图
单变量、多变量分析绘图 1、单变量分析绘图 单变量其实就是我们通常接触到的数据集中的一列数据 单变量分析是数据分析中最简单的形式,其中被分析的数据只包含一个变量,因为它是一个单一的变量, 它不处理原因或者关系 单变量分析的主要目的是描述数据并找出其中存在的模式,也就是“用最简单的概括形式反映...原创 2021-01-05 18:38:40 · 1776 阅读 · 0 评论 -
Seaborn的使用以及调色板的设置
Seaborn的使用以及调色板的设置 1、Seaborn简介 Seaborn是基于Python并且非常受欢迎的图形可视化库,并且在matplotlib的基础上进行了更高级的封装 使用作图更加方便快捷,可以通过极简的代码做出十分具有价值并且非常美观的图形 同样在使用的时候需要导...原创 2021-01-04 15:54:31 · 1805 阅读 · 0 评论 -
绘制双Y轴坐标系及其设置
绘制双Y轴坐标系及其设置 1、绘制双Y轴坐标系 在数据分析时,有时候我们需要在同一坐标图中比较两种数据在时间序列上面的关系 由于两种数据的单位和数据并不统一,也是不同的类型的数据,因此我们不能用一个Y轴来共同衡量两类 不同的数据,这时候我们就需要绘制双Y轴图。 绘制...原创 2020-12-31 14:44:57 · 1321 阅读 · 0 评论 -
柱状图、直方图、散点图、饼图讲解
柱状图、直方图、散点图、饼图讲解1、柱状图 柱状图适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较。 例如:年销售额就是二维数据,”年份”和”销售额”就是它的两个维度,但只需要比较”销售额”这一个维度 特点:柱状图利用柱子的高度来反应数据的差异,肉眼对于高度的差异很敏感,辨识效果非常好! 柱状图的使用方法: 前面的折线图使用的是plot函数,但是柱状...原创 2020-12-30 10:49:25 · 6560 阅读 · 0 评论 -
seaborn安装成功但是导入时出现错误
ImportError: DLL load failed: 找不到指定的模块在命令框中执行以下命令:1、pip uninstall scipy seaborn 重新卸载seaborn2、pip install -i https://pypi.tuna.tsinghua.edu.cn/simple scipy seaborn 之后重新安装一下,-i后面的...原创 2020-12-22 10:28:32 · 1040 阅读 · 0 评论 -
关于anaconda3安装好之后输入conda以及jupyter notebook报出错误或者是命令不存在的问题解决方法
问题一: 1、如果anaconda3安装好之后输入conda报出命令不存在问题! 首先可以看一下安装之后一下软件存不存在? 如果不存在的话建议重新安装,如果存在的话可以先在cmd命令框中输入conda看一下会不会出现正常的信息,如果报出conda不是文件命令的话就需要配置环境变量环境变量的配置:首先点开右击桌面的此电脑(计算机/我的电脑),之后点击属性,之后...原创 2020-12-21 12:26:38 · 2337 阅读 · 0 评论 -
Matplotlib可视化图形中文设置、自定义刻度以及多图显示
Matplotlib可视化图形中文设置、自定义刻度以及多图显示 1、中文显示 事实上,matplotlib是支持unicode编码的,中文乱码的主要问题是没有找到合适的中文字体。 如果想要实现Matplotlib显示中文我们有三种方法: 第一种:直接修改Matplotlib配置文件matplotlibrc 第二种:动态修改配置 ...原创 2020-12-15 18:53:25 · 1243 阅读 · 0 评论 -
数据可视化模块Matplotlib的使用以及折线图
数据可视化模块Matplotlib的使用以及折线图 1、Matplotlib是什么? Matplotlib是一个Python的2D绘图库,它可以在各种平台上以各种硬拷贝格式和交互环境生成具有出版品质的图形。 Matplotlib师徒让简单的事情变得更简单,让无法实现的事情变得可能实现,是Python中最常用的可...原创 2020-12-15 16:23:15 · 384 阅读 · 0 评论 -
数据分析中的日期时间以及操作方法
数据分析中的日期时间以及操作方法 1、日期和时间数据类型 时间序列数据(Time Series Data)是在不同时间上收集到的数据,这类数据是按时间排序收集到的,用于描述现象 随时间变化的情况 Python标准库包含了日期和时间数据的数据类型,datetime模块是开始处理时间数据最广泛的。...原创 2020-12-14 15:25:55 · 1546 阅读 · 0 评论 -
数据的多层索引以及多层索引的排序
数据的多层索引以及多层索引的排序 1、多层索引的创建 对于Series对象: 示例: import pandas as pd Se=pd.Series([1,2,3,4],index=[["张三","张三","李四","李四"], ...原创 2020-12-14 15:24:16 · 805 阅读 · 0 评论 -
数据的分组以及统计
给数据分个班1、对数据进行分组 单列分组 Pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作 而进行分组之后是一个DataFrameGroupBy object,是一个分组后的对象 df.groupby("gender") 但是因为分组之后是一个DataFrameGroupBy object对象,所以可以使...原创 2020-12-08 18:36:38 · 1078 阅读 · 0 评论 -
数据合并以及排序学习
5、数联璧合1、数据的合并,数据的合并主要是有两种方式 轴向合并: 轴向连接(concatenation),pd.concat()可以沿一个轴将多个DataFrame对象连接在一起,形成一个新 的DataFrame对象。 concat()函数可以将数据根据不同的轴作进行合并。我们先看一下concat()的常用参数: 语法: pd.concat(objs, axis=...原创 2020-12-04 19:01:58 · 460 阅读 · 0 评论 -
数据以及空值数据处理方法
第四节 数据七十二变1、对于简单的数据删除空值数据(NaN)——对于简单的数据进行过滤,如果对于负责的 DataFrame对象进行使用则会存在空值数据过滤不干净 import pandas as pd——导入模块 li=[2,NaN,4,6,NaN,4]——数据集 se=pd.Series(data=li)——生成Series对象 se.notnull()——对是否是空值数据进行判...原创 2020-11-22 21:32:22 · 6676 阅读 · 0 评论 -
数据分析了解
第一节:运筹帷幄,决胜千里1、 Pandas模块是python中最重要的数据分析工具包,是Panel Data Analysis的缩写,Pandas 是基于NumPy 的一种工具, 该工具是为了解决数据分析任务而创建的,Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集 所需的工具,Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。 Matplotlib和Seaborn是最常用的数据可视化的工具包,解决如何通过数据来绘制图表,来更好的展示数.原创 2020-11-09 14:29:46 · 121 阅读 · 0 评论 -
在anaconda中的jupyter里面运行numpy程序报出在使用numpy时报错RuntimeWarning: numpy.dtype size changed类似的错误原因
在anaconda中的jupyter里面运行numpy程序报出在使用numpy时报错以下错误:RuntimeWarning: numpy.dtype size changed类似的错误原因 因为安装的numpy版本太高,和其他的库不匹配解决方法 第一步:卸载numpy pip uninstall numpy 第二步:安装低版本的numpy库 ...原创 2020-11-22 12:49:32 · 750 阅读 · 0 评论 -
pandas读写表格
第三节:一、用pandas对于表格的读写操作 1、对于CSV格式文件的写入: (1)使用函数to_csv函数 import pandas as pd df=pd.DataFrame(data=数据)————生成一个DataFrame对象 df.to_csv(path_or_buf="文件名.csv",encoding="utf_8_sig"...原创 2020-11-09 14:33:38 · 258 阅读 · 0 评论 -
Series和pandas讲解
第二节1、Series的属性与方法: Series中一般常用的参数就是data、index,其中的data就是我们处理的数据,index就是这个数据的行索引 Series中的函数一般有index、values以及items,values、index、items返回的对象分别是List、Index、 Zip类型的数据,为了方便我们使用和观察数据,可以使用series.index.tolist()和list(series.it...原创 2020-11-09 14:31:33 · 509 阅读 · 0 评论