- 最终呈现给用户的必须是能够被高效理解并使用的
相对于改变世界改变人类的Google,对于算法工程师而言,该做的不是迷信大数据,而是把大数据给提取成小数据,利用小数据为企业创造价值。大数据标志着需要更大规模的集群,更大规模的计算能力,更长的生产周期,而这些都是企业的“成本”,对于大部分公司,基本面临的都是两个问题,如何拿到数据和如何利用数据,而不是如何“最好”地利用数据。
同样的,对于非科学家所做的可视分析而言,不管是降维也好特征提取也好数据挖掘机器学习也好,需要做的是把从大数据中萃取出小数据,把小数据展示用户进行学习和分析。需要的是让用户能够快速有效地使用,而不是“最好最全”地展示分析数据。