python名单筛选

liulangzhehwm

已于 2024-06-15 17:23:27 修改

阅读量1.3k

点赞数 2

分类专栏：其他文章标签： python 开发语言

于 2022-03-16 22:42:01 首次发布

本文链接：https://blog.csdn.net/xiaiming0/article/details/123538679

版权

数据清洗原始数据新数据集人员增减差异分析

关键词由CSDN通过智能技术生成

其他专栏收录该内容

21 篇文章 0 订阅

订阅专栏

import re
import time

yuanshi = [] # 存储原始数据
xin = [] # 存储新的数据
result = [] # 存储新数据集中没有在原始数据集中的数据
people = 0 # 计算数据集中数据的个数

读取原始数据

f = open(“zong.txt”, “r”, encoding=‘utf-8’)

对原始数据进行清洗

for line in f.readlines():
line = line.strip(‘\n’) # 去掉列表中每一个元素的换行符
people = people+1
yuanshi.append(line)
print(“总共有：”, people, “人”)

people = 0

读取新的数据

f = open(“xin.txt”, “r”, encoding=‘utf-8’)
for line in f.readlines():
line = line.strip(‘\n’) # 去掉列表中每一个元素的换行符
# re.search(“[0-9]{3}”,“qw345erty”)
tempture = re.search(“[0-9]”, line) # 去点含有数字的无用数据
if tempture == None:
tempture = re.search(“[‘X’, ‘青年大学习’, ‘安徽省青年大学习’, ‘参与人数排行榜’, ‘姓名’, ‘时间’]”, line) # 去掉其他的数据无用数据
if tempture == None:
xin.append(line)
people = people+1
print(“完成有：”, people, “人”)

查找出新数据集中没有在原始数据集中的数据

people = 0
for i in yuanshi:
k = 0
for j in xin:
if i == j:
k = 1
if k == 0:
result.append(i)
people = people+1
print(“未完成有：”, people, “人”)
print(“分别是”, result)