pythonpandas重复数据统计_python – 计算Pandas DataFrame中的重复值

最新推荐文章于 2022-02-06 08:08:23 发布

weixin_39630466

最新推荐文章于 2022-02-06 08:08:23 发布

阅读量1.1k

点赞数 1

文章标签： pythonpandas重复数据统计

必须有一个简单的方法来做到这一点,但我无法在SO上找到一个优雅的解决方案或自己解决.

我正在尝试根据DataFrame中的列集计算重复值的数量.

例：

print df

Month LSOA code Longitude Latitude Crime type

0 2015-01 E01000916 -0.106453 51.518207 Bicycle theft

1 2015-01 E01000914 -0.111497 51.518226 Burglary

2 2015-01 E01000914 -0.111497 51.518226 Burglary

3 2015-01 E01000914 -0.111497 51.518226 Other theft

4 2015-01 E01000914 -0.113767 51.517372 Theft from the person

我的解决方法：

counts = dict()

for i, row in df.iterrows():

key = (

row['Longitude'],

row['Latitude'],

row['Crime type']

)

if counts.has_key(key):

counts[key] = counts[key] + 1

else:

counts[key] = 1

而我得到的数字：

{(-0.11376700000000001, 51.517371999999995, 'Theft from the person'): 1,

(-0.111497, 51.518226, 'Burglary'): 2,

(-0.111497, 51.518226, 'Other theft'): 1,

(-0.10645299999999999, 51.518207000000004, 'Bicycle theft'): 1}

除了这个代码也可以改进(随意评论如何),通过pandas做什么的方法？

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39630466

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

【Pandas数据处理100例】（八十五）：Pandas将DataFrame数据转化成字典数据

CSDN 精品推荐

11-30

1177

该函数可以实现将Pandas中的DataFrame数据导出为Python中的字典格式数据。

python-dataframe如何计算多条件下的重复次数

积少成多

08-03

1069

计算重复次数并每一行都标记

参与评论您还未登录，请先登录后发表或查看评论

dataframe 统计重复次数

sunzq55的博客

05-05

1万+

对重复数据列进行次数统计 data['列名'].value_counts() 输出结果是 series，列内容对应次数，即abc-123

python中dataframe怎么去重_pandasdataframe重复数据查看.判断.去重

weixin_39915668的博客

12-04

1712

Apple iPhone 11 (A2223) 128GB 黑色移动联通电信4G手机双卡双待4999元包邮去购买 >本文详解如何使用pandas查看dataframe的重复数据，判断是否重复，以及如何去重dataframe数据样本：import pandas as pddf = pd.DataFrame({'name':['苹果','梨','草莓','苹果'], 'price':[7,8...

【DataFrame】统计列中重复值

XMU20162841的博客

05-17

1万+

举个简单地栗子： import pandas as pd x=[{'id': 2, 'name':1,'value':1},{'id': 1, 'name':1,'value':2},{'id': 4, 'name':1,'value':3},{'id': 3, 'name':1,'value':4}] p =pd.DataFrame(x) 运行结果： 1、只看结果 # 一列，比如查看name...

Pandas学习笔记之重复数据统计

lansecheng的专栏

07-13

5258

在医院统计计算绩效数据，通过在网上搜索，发现Pandas确实在数据处理确实快。本文章持续更新和更改，只供自己学习使用一、重复数据查询：Pandas提供duplicated函数标记重复pandas.DataFrame.duplicated(self, subset=None, keep=’first’)subset：用于识别重复的列标签或列标签序列，默认所有列标签keep=‘frist’：除了第一次出

【Python】图解Pandas重复值处理

fengdu78的博客

08-15

5225

公众号：尤而小屋作者：Peter编辑：Peter今天带来的文章是关于Pandas中重复值处理。Pandas中处理重复值主要使用的是两个函数：duplicated()：判断是否有重复值dro...

pythonpandas重复数据统计_pandas dataframe重复数据查看.判断.去重

weixin_39593061的博客

12-08

4284

本文详解如何使用pandas查看dataframe的重复数据，判断是否重复，以及如何去重dataframe数据样本：import pandas as pddf = pd.DataFrame({'name':['苹果','梨','草莓','苹果'], 'price':[7,8,9,8], 'cnt':[3,4,5,4]})namecntprice0苹果 371 梨 4 82草莓 593苹果 68&g...

python pandas的dataframe 数据重构

碳酸

05-31

2193

数据：mr数据，每个采样点有主服务小区以及7个邻区的eci、rsrp、mr_count信息；需求：需要将邻区独立生成一个采样点，处理后采样点基本就是原数据的7倍大概就是这样子：使用stack/unstack可以很方便地进行行列转换，但想要的实现的要比行列转化更复杂些。不过使用pandas来处理也比较简单1、读取数据：t = pd.read_csv('./fastPg.csv',delimiter=...

Numpy及Pandas_numpy_pandas_dataframe_python_

09-30

Numpy和Pandas是Python中两个非常重要的数据分析和处理库，它们在科学计算领域有着广泛的应用。Numpy主要处理多维数组对象，而Pandas则在此基础上构建了更高级的数据结构，如DataFrame，用于进行数据清洗、分析和...

pandas官方文档中文版_pandas_pandas文档_pandas中文_python_

09-29

Pandas是Python编程语言中的一个强大数据分析工具，它提供了高效的数据结构，如DataFrame和Series，使得数据清洗、转换、分析变得简单易行。Pandas的设计目标是使数据处理对用户来说直观且快速，同时保持良好的性能...

对Python 2.7 pandas 中的read_excel详解

12-24

导入pandas模块： import pandas as pd 使用import读入pandas模块，并且为了方便使用其缩写pd指代。读入待处理的excel文件： df = pd.read_excel('log.xls') 通过使用read_excel函数读入excel文件，后面需要替换...

pandas官方文档中文版_pandas_pandas文档_python_

10-02

以上只是Pandas库的一部分核心功能，实际使用中，Pandas还有更多高级特性，如时间窗口操作、数据重塑、数据融合等，这些都使得Pandas成为Python数据科学领域不可或缺的工具。通过深入学习和实践Pandas官方文档中文版...

Python中找出dataframe中的重复的行 DataFrame.duplicated()方法

liujingwei8610的专栏

02-06

1万+

● 选择题以下关于DataFrame.duplicated()函数说法错误的是： A 该函数用于标记dataframe中内容重复的行 B 该函数返回值是一个序列，True表示重复 C 行内容被判定重复时，该行各列的值一定都重复 D keep参数默认取值为"first" ● 问题解析 1.DataFrame.duplicated(subset = None，keep ='first')函数用于找出dataframe的重复行。返回可以正确表示是否为重复行的布尔序列（即非重复项标记为False

Python 利用字典计算数据中不重复的数量

hongxue8888的博客

03-22

3646

因为字典的键必须是唯一的，那么将数据作为键值，那么键的数量就是不重复的数量 datas = "x1 x2 x2 x3 x4 x5 x6 x7 x7 x8 x9" for data in datas.split(): print(data) dict = {data: None for data in datas.split()}#data为键，None为键对应的值（任意值） pri...

Python pandas处理（提取/删除）DataFrame中的重复行