学习笔记之Python 数据分析
文章平均质量分 95
本栏目主要介绍Python 数据分析
随风的博客
Python新秀,只为记录自己Python学习心得笔记。
展开
-
pandas库相关函数及一般用法
概述:pandas 库提供了两种数据结构:Series 和 DataFrameimport pandas as pd #导入 pandas 库 简化为 pd函数 、 音标(读法)–单词中文意思 、 用法或示例、 说明1、pd.Series()、 [ˈsɪəriːz] --系列、示例1: surname = pd.Series([‘赵’, ‘钱’, ‘孙’, ‘李’])借助列表来创建 Series 对象的方法,也就是:pd.Series(data)示例2:# 创建两原创 2021-10-17 15:09:51 · 860 阅读 · 0 评论 -
数据分析六、案例实战---Apr 算法之公众号关联分析
案例实战---Apr 算法之关联分析一、案例背景二、明确目标三、数据处理四、数据分析五、数据展现二级目录三级目录一、案例背景二、明确目标三、数据处理四、数据分析五、数据展现二级目录三级目录...原创 2021-10-02 17:16:22 · 1406 阅读 · 1 评论 -
数据分析五、Apriori 算法之关联分析
agg方法与Apriori 算法一、agg()方法二级目录三级目录二、Apriori 算法一、agg()方法二级目录三级目录二、Apriori 算法原创 2021-09-12 23:31:03 · 8070 阅读 · 4 评论 -
数据分析四、数据展现---用matplotlib 库绘制图形
数据展现matplotlib库1.1、概述:1.2、pyplot模块1.3、matplotlib 库绘图1.3.1、画布的生成与保存:plt.figure()1.3.2、 设置 x/y 坐标值1.3.3、绘制折线图和柱状图1.3.3.1绘制折线图:plt.plot()1.3.3.2绘制 柱壮图:plt.bar()1.3.3.3绘制饼图1.4、设置图表标题:plt.title(label,fontsize)1.5、设置坐标轴1.6、设置图例1.7、设置数据标签三级目录matplotlib库1.1、概述:原创 2021-08-20 21:51:26 · 2145 阅读 · 0 评论 -
数据分析三、pandas库 分组聚合与数据可视化
分组聚合与数据可视化一、分组聚合1.1、单层分组聚合:df.groupby(by)['列索引'].mean()。1.1.1单层分组:df.groupby(by)1.1.2聚合操作:['列索引'].mean()1.2、 多层分组聚合:df.groupby(by)['列索引'].mean()。三级目录二、数据可视化一级目录二级目录一、分组聚合1.1分组聚合操作的定义分组聚合操作指的是按照某项规则对数据进行分组,接着对分完组的数据执行总结性统计的操作(比如求和、求均值)。根据其分组方式的不同可以分为单层分组原创 2021-08-17 23:17:34 · 1956 阅读 · 0 评论 -
数据分析二、pandas库数据处理
数据处理指的是根据数据分析的目的,将收集到的数据进行加工、整理,形成适合数据分析的样式。主要分三个步骤来处理我们的数据,它们分别是:数据清洗、数据整理以及数据写入。一、数据清洗以下表数据为例:这份数据索引为 1、3、4 的行完全重复。有一些数据的值为 NaN ,在 pandas 库中,NaN 代表缺失值,意思是这里的数据是空的。在订单量、单价和销售额列中,我们能明显看到 0 和 999999999.0 的数值。首先,订单量如果为 0,那么这样的订单根本就不应该出现,这些数据也完整存在异常。综上所原创 2021-08-13 00:55:46 · 2630 阅读 · 0 评论 -
数据分析一、 pandas库基础知识
一、jupyter 代码编辑器Cell [sel] 细胞jupyter 代码编辑器的一个代码单元,一般叫它 Cell。Cell 是这款 jupyter 代码编辑器的主要构成要素。代码的输入以及代码结果的输出都是在 Cell 中实现的。Cell 一共由两个部分组成:In[] 和 Out[],即输入框和输出框。Cell 在使用时有两个很重要的特点,第一点体现在查看变量的时候,第二点体现在变量值的传递上。查看变量值的时候,只要输入变量名就可以了。jupyter 代码编辑器第二个特点:当前的 Ce原创 2021-08-01 18:11:05 · 5707 阅读 · 0 评论