引言:人类的未来就是失控,就是人与机器共生、共存。机器越来越人性化, 人越来越机器化。《失控》这本书,主要就体现了这一思想。
本文选自《全栈数据之门》一书。
琅琊榜首,江左梅郎,得之可得数据科学之天下。 电视剧《琅琊榜》是一部良心好剧,精心制作的剧情,外加画面精美和台词的古典韵味,说其是一部男人的宫斗剧也不假,但更是一部数据分析的作品。其中,最让人感到神奇的是琅琊阁中神奇的情报分析中心,简直就是 一整套完整的数据分析流程,采集江湖与朝廷上重要人物、事件的信息,放到一个大的数据库中存储起来,然后对当前的时势进行预测分析。
用现在流行的话来说,琅琊阁就是一个大数据分析中心,专门产出各种 数据。主要涉及:排名算法(对江湖高手进行武力值排名),社交网络分析(重要人物都与哪些人有联系)。他们提供了一个著名的问答系统,世间难题, 只要给得起价,都可以在这儿得到答案。它还会做人才推荐引擎,向世间推荐人才,梅郎也是因为他们的人才推荐系统,才能名正言顺地进入朝廷。
琅琊阁地下室有一个非常庞大的数据仓库,用于存储与处理各种数据。 实际上,他们使用了很多数据挖掘算法,放到现在,就是构成机器学习的重要内容。
ML是一个非常有意思的词汇,初中生会告诉你,这是毫升的缩写。搞 数据科学的人会告诉你,这是Machine Learning(机器学习)的缩写。人都 会随着认识的不断改变,从而改变最初的一些认识。
机器学习,本身是一门交叉学科,以算法理论作为基础,其中涉及大量的统计学、线性代数、微积分、凸优化等数据理论,还包含数据库、编程等 计算机知识,因此学好机器学习,着实不那么容易。
下面是知识图谱(点击图片查看更加清晰)
图谱出自《全栈数据之门》一书,点此链接可在博文视点官网查看此书。