<< Machine Learning in Action >> Chapter one.
什么是机器学习?
机器学习是利用计算机技术分析数据背后的含义。
Terminology
特征(features):即一个实例所包含的属性(attributes);
训练集(training set):用于训练机器学习算法的样本数据集合;
分类:输出为离散的有限的代表类别的整形数或其他类型数据;
回归:输出为连续的数值;
语言
C/C++ + Python混合编程,同时利用了Python和C的优势,先使用Python编写能够运行的程序,然后使用C/C++替换核心代码提高性能。可以参考C++ Boost库、Cython和pypy工具等。
构建机器学习应用的一般步骤
- 收集数据
- 处理数据(格式)
- 分析数据(去除异常点)
- 学习
- 测试
- 使用算法