python破解qq密码_央·python编程之QQ数据清洗

一般我们从网上下下来的数据都很杂乱的,什么样的情况都有,不利于我们整理,所以在拿到数据的时候我们会先做一遍数据清理,把垃圾数据清理掉。

今天我们拿QQ数据做示范。

我们命令行是怎么看数据!

[Asm] 纯文本查看 复制代码more zy.txt

#然后空格进行翻页

效果如图:

55fd2b2273b5a8b4531f72773c469d6e.gif

1.png (11.5 KB, 下载次数: 0)

2018-1-30 17:54 上传

从数据中得知:

---- 中间4个-

左边是账号,右边是密码

目前QQ最多就11位,密码最长16位,所以数据中位数最多31位(4+11+16),大于的都是垃圾(第一轮筛选)

我先用python 读取QQ操作

[Asm] 纯文本查看 复制代码import codecs

filepath=r"C:\Users\Administrator\Desktop\zy.txt"

file=codecs.open(filepath,"rb","gbk","ignore")#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

#savefilepath="C:\Users\Administrator\Desktop\zy1.txt"

  • 1
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python中进行数据清洗可以使用多种方法。其中一种方法是使用列表推导式去除列名中的空格。首先,导入pandas库并读取CSV文件,然后获取列名列表。接下来,使用列表推导式对列名进行处理,去除空格。然后,删除重复值并重置索引。接着,填补"级别"列和"特色"列中的缺失值。最后,将清洗后的数据保存到CSV文件中。以下是一个示例代码: ```python import pandas as pd # 读取CSV文件 df = pd.read_csv("ResourceFile.csv") # 列名列表 ClName = df.columns.values # 使用列表推导式去除空格 df.columns = \[x.strip() for x in ClName\] # 删除重复值并重置索引 df.drop_duplicates(inplace=True) df.index = range(df.shape\[0\]) # 填补"级别"列和"特色"列中的缺失值 df.loc\[df.级别.isnull(),'级别'\] = "无级别" df.loc\[df.特色.isnull(),'特色'\] = "未知" # 保存文件 df.to_csv("ResourceFile.csv") ``` 这段代码会对CSV文件进行数据清洗,包括去除列名中的空格、删除重复值、重置索引以及填补缺失值。清洗后的数据会保存到同一个CSV文件中。 #### 引用[.reference_title] - *1* *2* [python数据清洗---实战案例(清洗csv文件)](https://blog.csdn.net/qq_45675449/article/details/115645184)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值