python数据清洗转化
文章平均质量分 85
rwangnqian
这个作者很懒,什么都没留下…
展开
-
使用pandas清洗数据(中文字符串的正则使用)
对于之前的从链家网爬取下来的福田区二手房的数据,只是为了提取信息。但是如果要进行数据分析必须对数据进行清理和转换。python的pandas库可以说是中等规模数据处理最好用的工具。下面我就来演示如何对以下数据进行处理:环境:win10 propython3.6pandas,re26105100952283 长城一花园南北通透精装三房拓出飘窗好楼层原创 2018-01-08 10:26:24 · 23396 阅读 · 1 评论 -
用pandas清洗数据具体步骤(基础篇一)
引言 数据清洗是一项复杂且繁琐(kubi)的工作,同时也是整个数据分析过程中最为重要的环节。但在实际的工作中一个分析项目70%左右的时间花在清洗数据上面。数据清洗的目的有两个,第一是通过清洗让数据可用。第二是让数据变的更适合进行后续的分析工作。换句话说就是有”脏”数据要洗,干净的数据也要洗。本篇文章将用一个简单的范例来介绍使用pandas进行数据清洗的流程。读取数据原创 2018-01-15 18:30:38 · 24532 阅读 · 5 评论 -
用pandas清洗数据具体步骤(基础篇二)
我们接着上一篇来做。我们可以先读取excel数据。然后进行以下操作:选取数据和更改行索引和列索引tt=pd.read_excel('d://new.xlsx')tt.columns=["m"+str(x).replace('/','') for x in tt.columns ]tt.index=tt.ix[:,0].values # 将第一列作为索引。不需要进行重新索引。但是不原创 2018-01-31 15:07:35 · 2324 阅读 · 0 评论