概述
机器学习是从数据中自动分析获得规律 (模型). 并利用规律对位置数据进行预测.
机器学习的价值
领域: 医疗, 航空, 物流, 电商…
目的: 让机器学习程序替换手动的步骤, 减少企业的成本也提高企业的效率.
例子: 一个汽车零售商将客户按照对汽车的喜好划分成不同的类, 这样营销人员就可以将新型汽车的广告手册直接邮寄到有这种喜好的客户手中, 从而大大增加了商业机会.
机器学习的数据
使用 csv 文件
为什么不能使用 mysql?
- 性能瓶颈, 读取速度
- 格式不太符合机器学习要求数据的格式
数据集的结构
可用数据集
结构组成
特征工程
特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程. 从而提高了对未知数据的预测准确性.