一般我们从网上下下来的数据都很杂乱的,什么样的情况都有,不利于我们整理,所以在拿到数据的时候我们会先做一遍数据清理,把垃圾数据清理掉。
今天我们拿QQ数据做示范。
我们命令行是怎么看数据!
[Asm] 纯文本查看 复制代码more zy.txt
#然后空格进行翻页
效果如图:
1.png (11.5 KB, 下载次数: 0)
2018-1-30 17:54 上传
从数据中得知:
---- 中间4个-
左边是账号,右边是密码
目前QQ最多就11位,密码最长16位,所以数据中位数最多31位(4+11+16),大于的都是垃圾(第一轮筛选)
我先用python 读取QQ操作
[Asm] 纯文本查看 复制代码import codecs
filepath=r"C:\Users\Administrator\Desktop\zy.txt"
file=codecs.open(filepath,"rb","gbk","ignore")#按照指定编码
mylist=file.readlines()#返回一个list,读取到内存
#savefilepath="C:\Users\Administrator\Desktop\zy1.txt"