这个也是统计次数,这个是统计IP出现最多的,将其在安全设备上封禁的,和迟到次数差不多,这个是全部打印,迟到是打印前20。
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('your_file.xlsx', engine='openpyxl')
# 假设 'IP' 是你想要处理的列的名称
# 统计每个 IP 地址出现的次数
ip_counts = df['IP'].value_counts()
# 将结果转换为 DataFrame
ip_counts_df = ip_counts.reset_index()
ip_counts_df.columns = ['IP', 'Count']
# 将结果保存到新的 Excel 文件中
ip_counts_df.to_excel('ip_counts.xlsx', index=False)
# 去重 IP 地址,保留第一次出现的
df_unique = df.drop_duplicates(subset='IP')
# 将结果保存到新的 Excel 文件中
df_unique.to_excel('unique_ips.xlsx', index=False)