Pandas统计指定列不重复的值的数目

最新推荐文章于 2023-12-31 19:08:34 发布

追枫萨

最新推荐文章于 2023-12-31 19:08:34 发布

阅读量9.6k

点赞数 1

分类专栏：数据科学文章标签： pandas

本文链接：https://blog.csdn.net/m0_38052384/article/details/102843863

版权

本文介绍了如何使用Pandas库在Python中统计DataFrame某一列的不重复或唯一值的数量。通过示例代码和结果展示，读者可以清晰地了解操作步骤。

摘要由CSDN通过智能技术生成

方法

方法:
   DataFrame.duplicated（subset = None，keep =‘first’ ）返回boolean数组 一个bool值代表一行
参数：
   subset：用来指定特定的列，默认所有列
 
   keep：{‘first’，‘last’，False}，默认’first’
   first：标记重复，True除了第一次出现。
   last：标记重复，True除了最后一次出现。
   False：将所有重复项标记为True。

csv内容

源码及结果

import pandas as pd

if __name__=="__main__":
    path = "./test.csv"
    # path_other = "./test_.csv"
    df = pd.read_csv(path, header=0, names=["DEVICE_ID","LNG", "LAT","TEN_GROUP","WEEKDAY","FLOW"])
    # df.to_csv(path, mode="a", index=False, header=False)
    print("