![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
金帛文武在南京
这个作者很懒,什么都没留下…
展开
-
python读取txt文件最后一行(文件大+文件小)
txt文件小#coding:utf-8 ''' fname为所读xx.txt文件 输出为:文件第一行和最后一行 '''fname = 'test.txt' with open(fname, 'r') as f: #打开文件 lines = f.readlines() #读取所有行 first_line = lines[0] #取第一行 last_line = lines[-原创 2016-04-05 20:33:36 · 27764 阅读 · 3 评论 -
数据清洗经验
数据为什么需要清洗 字段缺失 前后结构不一致 数据取值范围不对 不是易于分析的格式 清洗数据技巧 使用断言 Assertions 例如每条记录有4个字段,断言之; 某个字段是整数,断言之。反正,能断言的都断言,不要嫌麻烦。 对于不完整或者损坏的记录,不要默默跳过 可以打印出提示信息,方便之后查找 记录跳过记录的条数,和总记录数,看看比例 如果有枚举字段,且种类多,可以不用断言,遇到新种类时打印原创 2017-03-02 20:57:29 · 832 阅读 · 0 评论