参考资料:
黑马程序员3天快速入门python机器学习
摘要:
人工智能阶段
机器学习 三天
深度学习 三天
量化交易 四天
人工智能阶段课程安排
1.机器学习概述
了解机器学习定义以及应用场景
说明机器学习算法监督学习与无监督学习的区别
说明监督学习中的分类、回归特点
说明机器学习算法目标值的两种数据类型
说明机器学习(数据挖掘)的开发流程
1.1 人工智能概述
机器学习和人工智能,深度学习的关系
- 机器学习是人工智能的一个实现途径
- 深度学习是机器学习的一个方法发展而来
机器学习、深度学习能做些什么
机器学习的应用场景非常多,可以说渗透到了各个行业领域当中。医疗、航空、教育、物流、电商等等领域的各种场景。
-
用在挖掘、预测领域:
应用场景:店铺销量预测、量化投资、广告推荐、企业客户分类、SQL语句安全检测分类… -
用在图像领域:
应用场景:街道交通标志检测、人脸识别等等 -
用在自然语言处理领域:
应用场景:文本分类、情感分析、自动聊天、文本检测等等
1.2 什么是机器学习
定义:机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。
我们人从大量的日常经验中归纳规律,当面临新的问题的时候,就可以利用以往总结的规律去分析现实状况,采取最佳策略。
- 从数据(房屋的各种信息)中自动分析获得模型(判断房屋价格的规律),从而使机器拥有预测房屋价格的能力。
- 从数据(大量的猫和狗的图片)中自动分析获得模型(辨别猫和狗的规律),从而使机器拥有识别猫和狗的能力。
从历史数据当中获得规律?这些历史数据是怎么的格式?
数据集构成
特征值 + 目标值
1.3 机器学习算法分类
如果按照学习方式分类可分为
如果按照学习任务分类可分为以下三类:
1.4 机器学习开发流程
1)获取数据
2)数据处理
3)特征工程
4)机器学习算法训练 - 模型
5)模型评估
6)应用
1.5 学习框架和资料介绍
1)算法是核心,数据与计算是基础
2)找准定位
大部分复杂模型的算法设计都是算法工程师在做,而我们
分析很多的数据
分析具体的业务
应用常见的算法
特征工程、调参数、优化
3)怎么做?
学会分析问题,使用机器学习算法的目的,想要算法完成何种任务
掌握算法基本思想,学会对问题用相应的算法解决
学会利用库或者框架解决问题
机器学习库与框架
书籍资料—实践类
提深内功
2.特征工程
了解特征工程在机器学习当中的重要性
应用sklearn实现特征预处理
应用sklearn实现特征抽取
应用sklearn实现特征选择
应用PCA实现特征的降维
2.1 数据集
2.1.1 可用数据集
公司内部 百度
数据接口 花钱
2.5 特征降维
学习目标
目标
知道特征选择的嵌入式、过滤式以及包裹氏三种方式
应用VarianceThreshold实现删除低方差特征
了解相关系数的特点和计算
应用相关性系数实现特征选择
应用
无