- 博客(2)
- 收藏
- 关注
原创 Google File Syetem paper review
Google File Syetem paper review1. The problem2. Challenge3. key insight4. Limitation5. Future workReference1. The problemThe paper tried to design a new file system, Google File System, to fit the r...
2019-03-12 12:21:41 186
翻译 数据清洗(data cleaning)
大数据数据清洗(data cleaning)定义1. 缺省值2. 噪声实际过程1. 偏差检测(disrepancy detection)2.数据变换3.迭代执行步骤1和2定义现实世界的数据一般是不完整的,有噪声的和不一致的,数据清洗试图填充缺失的值,光滑噪声并识别离群点,纠正数据中的不一致所以根据定义,主要有两种值需要进行数据清洗:1. 缺省值可以使用回归,贝叶斯或者决策树,通过已有数据...
2019-03-12 12:14:43 5832 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人