.describe() python_用Python做描述统计

最新推荐文章于 2024-06-04 18:12:45 发布

weixin_39573512

最新推荐文章于 2024-06-04 18:12:45 发布

阅读量804

点赞数

文章标签： .describe() python python (describe())

一直用零零散散的时间自学Python，之前一直都在模仿书上的整理好的程序来做，今天准备自己动手

从阿里巴巴天池下载的数据，只有用户ID，购买ID，购买时间，购买数量，商品属性，还有一张表更简单，就只有用户ID，出生日期和性别

首先，Python描述统计分析，describe函数中的include设置为all意思就是描述所有数值型数据和离散型数据，如果不设置，默认就是只描述数值型数据

import

结果用户编号、商品编号还有日期都被解读成数值型数据了，所以重新来过吧

先把用户编号，商品编号，商品类别转化为文本型数据，再把日期数据转化为日期，代码如下

sales_data=pd.read_csv('sale_data.csv',parse_dates=['day'],
                       dtype={'user_id':str,'auction_id':str,
                              'cat_id':str,'cat1':str})
sales_data.describe(include='all')

结果如下

本来是想对数据做一下RFM分析的，重复最多的用户编号只有4次，放弃这个想法；

然后之后的项目编号、分类编号还有根分类可以发现客户购买的产品还是挺分散的；

之后的购买数量也是说明了这个问题，最大值为10000，这个很可能是异常值，大部分客户都是买的1件商品

从购买日期上看14年的双十一这天重复出现了454次，看来双十一这个活动还是挺影响销量的

下一篇讲数据可视化想从购买时间和购买数量入手，说说这部分数据对库存的影响

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39573512

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python有趣|数据分析三板斧

罗罗攀

03-12

388

前言天下武功中，哪个是最简单，最实用的了？那当然是程咬金的三板斧。传说中，程咬金晚上睡觉，梦见一老神仙，教了他三十六式板斧，这套功夫威力极大，而且招式简单，十分适合程咬金...

.describe() python_【python小白上路系列】函数

weixin_39977547的博客

11-22

871

第二个周末持续加班了，体力严重透支。在本章中，你将学习编写函数。函数是带名字的代码块，用于完成具体的工作。要执行函数定义的特定任务，可调用该函数。需要在程序中多次执行同一项任务时，你无需反复编写完成该任务的代码，而只需调用执行该任务的函数，让Python运行其中的代码。你将发现，通过使用函数，程序的编写、阅读、测试和修复都将更容易。在本章中，你还会学习向函数传递信息的方式。你将学习如何...

参与评论您还未登录，请先登录后发表或查看评论

python函数简介

Ydoing的专栏

03-11

124

这里先解释一下几个概念 - 位置参数:按位置设置的参数,隐式用元组保存对应形参.平时我们用的大多数是按位置传参.比如有函数def func(a,b,c),调用func(1,2,3).即a=1,b=2,c=3 - 关键字参数:可以通过关键字设置参数,不用关心参数位置,隐式用字典保存形参.比如有函数def func(a,b,c),调用func(b=1,c=2,a=3),即a=3,b=1,c=2 ...

一文看懂Python 数据分析基础-以世界500强为例

samuelzhanmk的博客

10-26

650

上篇文章提到了如何爬取500强的信息，本次我们来讲下如何通过python进行数据分析。开始前先说个数据，2020年世界500强中国（包含香港和台湾）有133家企业入围，合计GDP达到8.7万亿美元，而中国大陆去年的GDP才14.1万亿美元，头部聚集效应可想而知。下面我们来用Python来看怎么分析这些数据。本文用示例来讲解如何掌握python数据分析的基本方法一、Python读取文件的方法二、数据的基础描述三、DataFrame 排序、增删行列操作四、DataFrame数据处理：求和

【Python】进阶学习：pandas--describe()函数的使用介绍

创作高质量博文，分享知识，共同进步！

03-04

5209

📚进阶学习pandas的旅程再添一笔！🖊本文将深入探索pandas库中强大的describe()函数，从初识到精通，带你领略数据描述的魅力。📊掌握基本用法，定制输出，并与数据可视化结合，让你的数据分析更上一层楼！💡同时，我们将深入理解统计指标，助你成为数据分析高手。🔍最后，总结与进阶学习指引，期待与你共同进步，探索数据世界的无限可能！#pandas #describe函数 #数据分析 #数据可视化 #进阶学习

.describe() python_使用python进行常见统计分析

weixin_39881167的博客

11-19

1858

不可否认的是python的统计功能若于R和SAS，但对于常见的统计分析，python亦可以实现。本文介绍Python中的ggplot2绘图库：plotnine，使用python完成常见的统计描述、分布差异检验、相关分析和回归分析方法。# plotnine：python中的ggplot2 使用 plotnine 库自带的 mtcars 汽车数据集选取 mtcars 的子集 df，共 32 个记录，6...

python的describe参数_Python Pandas Series.describe()用法及代码示例

weixin_39715652的博客

02-21

2427

Pandas 系列是带有轴标签的一维ndarray。标签不必是唯一的，但必须是可哈希的类型。该对象同时支持基于整数和基于标签的索引，并提供了许多方法来执行涉及索引的操作。Pandas Series.describe()函数会生成描述性统计信息，以汇总给定系列对象的数据集分布的集中趋势，离散度和形状。通过排除NaN值来执行所有计算。用法： Series.describe(percentiles=No...

python的df.describe()函数

最新发布

changzi990的博客

06-04

1046

函数输出的统计指标对于正确解读数据至关重要。例如，标准差可以告诉我们数据集的离散程度，中位数则可以告诉我们数据集的中心趋势，而不受极端值的影响。函数输出的统计信息经常与数据可视化结合使用，以更直观地了解数据的分布。例如，我们可以使用matplotlib库来绘制箱线图（boxplot）。在数据分析和处理的过程中，我们经常需要了解数据的基本统计信息，如均值、标准差、最小值、最大值等。函数为我们提供了这样的功能，它可以快速生成数据集的描述性统计信息。函数提供了多个参数，允许我们定制输出的统计信息。

.describe() python_Python数据分析：探索性分析

weixin_39582708的博客

11-20

1324

写在前面如果你忘记了前面的文章，可以看看加深印象：Python数据处理Python数据分析实战(2)：缺失值处理Python实战分析：获取数据然后可以进入今天的正文一、描述性统计分析Excel里可以用【数据分析】功能里的【描述统计】功能来查看数据集常用的统计指标，但这里只能是对数值型的数据进行统计。pandas里可以用describe方法对整个数据集做一个描述性统计分析，当然这里也只是对数值型数据...

python_sitka_weather_07-2014.csv

12-29

这样的数据可以用于气象学研究，教学示例，或者展示如何使用Python进行数据清洗、可视化和统计分析。使用Python处理CSV文件时，首先需要导入`pandas`库，然后使用`read_csv()`函数加载数据。例如： ```python ...

describer:一个简单的python模块，帮助在arcpy中使用Describe函数

07-06

描述者描述器试图通过根据输入数据类型显示您有权访问的所有有效属性，使函数更加用户友好。例如，描述地理数据库要素类意味着您可以访问。您还可以使用可用的等。这意味着您必须导航多个资源页面以确定哪些属性可用于任何给定的输入。描述器使用 hasattr(object, name) python 内置函数来查找给定描述对象的所有有效属性。这个技巧已经在 ArcGIS 文档中暗示过：如果您尝试访问 Describe 对象不具有的属性，它将抛出错误或返回空值（无、0 或 -1 或空字符串）。如果您不确定某个特定属性，可以使用 Python 的hasattr()函数进行检查。 Describer 还会为您进行描述，因此在将输入输入到类中之前无需使用 arcpy 来描述输入。例子 import describer desc = ' \\ Example.gdb' D = desc

python describe

LL_QQ63的博客

03-25

1105

#针对变量较多，describe方法无法完全显示，因此写自定义函数，查看数值型数据中的数据分布情况 #需要计算的指标：均值mean、方差std、最小值min、 import numpy as np import pandas as pd from scipy import stats data=pd.read_csv() def desc(data): #筛选出数值型的数据 df=data.copy() #新建一个DataFrame，记载各变量的数据类型，便于后续筛选 .

Day 1 - 基本语法

qq_41175455的博客

09-22

1241

Day 1 1.基本语法一、语句（1条有效程序） print('你好！') print('世界！') # 一行有多条语句，要用分号隔开 print('你好！');print('世界！') 二、注释注释是代码中不参与编译执行的说明性文字（不影响程序功能） # 单行注释————Ctrl+/ print('hello world!') # 在控制台打印hello world! # 多行注释————将文字放入一对'''或"""之间 """ 注释1 注释2 注释3 """ ''' A B

python describe函数_Python pandas.DataFrame.describe函数方法的使用

weixin_39640265的博客

12-09

6954

DataFrame.describe(self, percentiles=None, include=None, exclude=None)生成描述性统计数据，总结数据集分布的集中趋势，分散和形状，不包括NaN值。分析数字和对象系列，以及DataFrame混合数据类型的列集。输出将根据提供的内容而有所不同。有关更多详细信息，请参阅以下注释。参数：percentiles：列表类似数字，可选要包含...

小菜鸟的python学习之路（7）

weixin_41953800的博客

10-10

413

学习阶梯《Python编程：从入门到实践》第一部分：基础知识第8章函数函数是带名字的代码块，用于完成具体的工作。定义函数 greeter.py def greet_user(): """显示简单的问候语""" print("Hello!") greet_user() 函数定义关键字是def, 定义以冒号结尾紧跟的冒号后的所有缩进行构成了函数体 “”"括起来的是文档字符串的注释，描述了函数是做什么的，python可以用他们来生成有关程序中函数的文档。

python describe函数,Python函数基本使用原理详解

weixin_26749843的博客

03-25

1953

1.什么是函数函数就相当于具备某一功能的工具函数的使用必须遵循一个原则：先定义后调用2.为何要用函数1、组织结构不清晰，可读性差2、代码冗余3、可维护性、扩展性差3、如何用函数1.函数的定义定义的语法'''def 函数名(参数1,参数2,...):"""文档描述"""函数体return 值1. def: 定义函数的关键字；2. 函数名：函数名指向函数内存地址，是对函数体代码的引用。函数的命名应该反...

python各种类型图解_Python基础知识两部曲:二

weixin_39811193的博客

12-05

156

如果没有看基础部分第一章，请前往Python基础知识两部曲：一8.函数1.定义函数：使用关键字def来告诉python你要定义一个函数接着指出函数名：如下面函数名是--greet_user()是必须带上的，这里可以可以传递一些参数，也可以不传以:结尾，且与后面所有的缩进构成了函数体调用函数直接写上函数名，如果有参数记得带上参数1.无参数的函数：defgreet_user():"""显示...

2020-10-31

qq_44984954的博客

10-31

109

Python 函数与模块函数的定义及其调用函数的定义不带参数的函数定义： def +函数名（）：注意：定义完函数之后的冒号“:”不能省略，下一行函数内容要进行缩进四个字符如： def fun(): 带参数的函数定义： def +函数名（name,age）：其中的name和age都是形参，调用函数时可用实参调用函数的调用 import 函数所在的.py文件函数所在.py文件.函数名（）假设fun()函数在test.py中定义: def fun()： print(“hell

python描述符详解_Python 的描述符 descriptor详解

weixin_39620370的博客

12-06

210

Python 在 2.2 版本中引入了descriptor(描述符)功能，也正是基于这个功能实现了新式类(new-styel class)的对象模型，同时解决了之前版本中经典类 (classic class) 系统中出现的多重继承中的 MRO(Method Resolution Order) 问题，另外还引入了一些新的概念，比如 classmethod, staticmethod, super, ...