看了一篇陈皓的关于大数据的文章《数据的游戏:冰与火》(
http://coolshell.cn/articles/10192.html),里面提出了一些新颖的且发人深思的观点,列举如下:
- 数据并不是大就好,数据的质量非常重要
- 数据分析要找准应用场景,有些场景很难用数据挖掘技术 (比如推荐一款衣服)
- 数据分析的结果要有用,即结果要能够指导下一步的行动
顺便他还介绍了数据分析中的三中角色:
- Data Analyzer
抽取数据,并将脏数据洗干净。
- Research Scientist
建立数据模型。
- Software Developer
陈皓觉得:实现算法。
- 最有技术含量的是 Scientist
- 最苦逼,也最累,但也最重要的是Data Analyzer
- 最没技术含量的是Software Developer