数据清洗
江水居士
这个作者很懒,什么都没留下…
展开
-
Using openRefine
总览:无论是现今的大数据还是企业内部的小数据,都存在一些普遍的问题,如数据格式不对需要转换,一个单元格内包含多个含义的内容,包含重复项等等,虽然我们也可以使用excel解决,但是excel天生有诸多限制,比如其为直接对数据进行操作,容易导致误操作;数据量大会处理缓慢;透视表功能太过简单;无法进行高级的数据分类分析。而OpenRefine很好的解决了以上问题,最重要的一点是它还是免费的!!附:...转载 2019-07-22 10:25:43 · 1130 阅读 · 0 评论 -
openRefine使用报告
一、openrefine简介数据清洗Data Cleaning:是尝试通过移除空的数据行或重复的数据行、过滤数据行、聚集或转换数据值、分开多值单元等,以半自动化的方式修复错误数据的过程。数据清洗是一个反复的过程,不可能在几天内完成,只有不断的发现问题,解决问题。对于是否过滤,是否修正一般要求客户确认。IDTs:Interactive Data Transformation tools,交互数据...原创 2019-07-22 16:22:04 · 4163 阅读 · 4 评论