第一章要点
>
1. 如何利用开放的API来搜集数据,将各种机器学习算法和统计方法结合起来,就可以借助集体智慧的相关方法,对由自己编写的应用程序搜集得到的数据进行分析;同时,也可以从其他地方搜集数据,对数据进行试验
2. 机器学习时人工智能领域中与算法相关的一个子域,允许计算机不断地进行学习,这相当于将一组数据传递给算法,并由算法推断出与这些数据的属性相关的信息,借助这些信息,可以预测出未来有可能会出现的其他数据。
3. 很多机器学习算法都很依仗数学和统计学,简单的相关分析和回归都是机器学习的基本形式。
4. 机器学习的局限,机器学习方法只能凭借已经见过的数据记性归纳,而且归纳的方式受到很大的限制。如果一个模式不同于算法先前所见过的任何其他模式,就很有可能会被“误解”
提供推荐
>
1. 如何根据群体偏好为人们提供推荐,如何构筑一个系统,用以寻找具有相同品味的人,并根据他人的喜好自动给出推荐
2. 搜集偏好,寻找一种表达不同人及其偏好的方法。(Python中使用嵌套的字典来实现非常简单)
3. 搜集数据后,可以将每个人与其他所有人进行对比,并计算他们的相似度评价值。计算相似度评价值的体系:欧几里德距离和皮尔逊相关度