import pandas as pd
import string
# 读取 Excel 文件,指定 sheet 名称以及 art_content 列的数据类型为字符串
df = pd.read_csv(r'C:\Users\win10\Desktop\新建文件夹\汇总.csv', dtype={'art_content': str})
# 使用 fillna() 方法将缺失值替换为空字符串
df['art_content'] = df['art_content'].fillna('')
# 使用布尔索引(Boolean Indexing)筛选 art_content 列中包含英文的行
en_df = df[df['art_content'].apply(lambda x: all(c in string.printable for c in x))]
# 将筛选结果保存到新的 Excel 文件中
en_df.to_csv(r'C:\Users\win10\Desktop\新建文件夹\汇总.csv', index=False)
筛选excel表只有英文的内容
最新推荐文章于 2024-10-03 09:02:12 发布
该代码段使用pandas读取CSV文件,将art_content列的数据类型设置为字符串,用空字符串填充缺失值。然后,通过应用lambda函数检查art_content列中是否只包含英文字符,并将满足条件的行保存到新的CSV文件中。
摘要由CSDN通过智能技术生成