python中统计列表list、dataframe以及Series中的不重复元素及其相应个数

方法1
#say为所要统计的列表
mylist = set(say)            #将列表中的元素无重复的抽取出来,赋值给另一个列表
for item in mylist:
    print item + str( say.count(item))          #list.count(item)  输出item在list中出现的次数
 
方法2
counts = { }          #字典
for x in time_zones:                      #time_zones 为列表
    if  x in counts:
        counts[x] += 1
    else:
        counts[x] = 1
print  counts

方法3(Series与Datafram用法相同)
import numpy as np  
import pandas as pd  
from pandas import DataFrame  
from pandas import Series  
ss = Series(['Tokyo', 'Nagoya', 'Nagoya', 'Osaka', 'Tokyo', 'Tokyo'])     
ss.value_counts()   #value_counts 直接用来计算series里面相同数据出现的频率  
结果如下:
Tokyo     3
Nagoya    2
Osaka     1

print(ss.unique())  #输出series中的无重复数据

  • 6
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 要提取DataFrame的某一列为列表,可以使用DataFrame的`tolist()`函数或者将该列转换为Series后再使用`.tolist()`函数。 示例代码如下: ```python import pandas as pd # 创建一个DataFrame data = {'Name': ['Tom', 'Nick', 'John', 'Marry'], 'Age': [28, 32, 25, 30], 'City': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']} df = pd.DataFrame(data) # 使用tolist()函数提取某一列为列表 name_list = df['Name'].tolist() print("通过tolist()函数提取的Name列为列表:", name_list) # 将某一列转换为Series后再使用.tolist()函数提取为列表 age_series = df['Age'] age_list = age_series.tolist() print("通过将Age列转换为Series后再使用.tolist()函数提取为列表:", age_list) ``` 以上代码,首先创建了一个DataFrame,包含了Name、Age和City三列数据。然后使用`.tolist()`函数分别将Name列和Age列提取为列表。最后通过print语句输出结果。 ### 回答2: 可以使用pandas库的to_list()方法来将DataFrame的某一列提取为一个list。假设我们有一个DataFrame df,其包含了三列数据(column1, column2, column3)。如果我们想要提取column1列并转换为一个list,可以使用以下代码: ```python column1_list = df['column1'].tolist() ``` 通过这个操作,我们就能够将DataFrame的column1列提取为一个list并赋值给column1_list。这个list包含了column1列的所有元素。可以根据实际需求进行相应的修改和调整。 需要注意的是,提取为list后,list元素会保持原有的数据类型。如果column1列包含了字符串、数值或其他类型的数据,则这些数据在转换后仍然会保持原来的数据类型。 ### 回答3: 在Python,可以使用pandas库来处理数据框(DataFrame),提取其的某一列并将其转换为列表。以下是一个简单的实现代码: ```python import pandas as pd # 假设有一个名为df的数据框,其包含多个列 # 提取其的某一列,比如名为'column_name'的列 column_list = df['column_name'].tolist() # 打印提取得到的列表 print(column_list) ``` 在代码,首先导入了pandas库。然后,假设有一个名为df的数据框,其包含多个列。接下来,使用`df['column_name']`来提取名为'column_name'的列,并使用`tolist()`方法将其转换为列表。最后,使用`print()`函数打印提取得到的列表。 需要注意的是,`tolist()`方法返回的是一个Python列表,而不是pandas的Series对象。这意味着,提取得到的列表可以直接用于其他操作,而不需要使用pandas库的函数进行处理。 希望以上回答能够对您有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值