什么是AI
AI is the field that studies the synthesis and analysis of computational agents that act intelligently.
AI are systems that think like humans ,act like hummans , think rationally, act rationally.
限制领域AI(Narrow AI):针对某一领域.
通用AI(General AI):让AI做任何事情,现阶段暂时无法达到这样的水平.
所以一定要认清技术的边界以及定义好问题的范围.
https://mp.weixin.qq.com/s/WOVVnZYTHCVAVHU6hNQcAQ
AI和BI的区别:简单的来说,BI是一种分析工具,通过一些方式吧数据更直观的展示给用户,辅助人去决策.另一方面,AI是通过数据帮助人做决策.所以从这个角度,可以把AI看作是辅助的决策工具,而AI则可以直接帮我们做决策.
什么是机器学习?
通俗来讲,机器学习是解决人工智能问题的最核心的技术.
官方定义: Field of study that gives computers the ablility to learn without being explicitly programmed.
机器学习的核心是,从数据中自动学出规律,而不是一个人拍脑袋定出来的,可以理解为归纳总结.
什么是深度学习
深度学习是机器学习的一个分支.
官方定义:Deep Learning is a subfield of machine learning concerned with algeorithms insbired by the structure and function of zhe brain called artificial neural nteworks.
深度学习是一个框架或者认为是一类方法论.深度可以理解为将很多简单的莫i行叠加在一起,比如我们把一个神经网络叠加成多层结构的时候,得到的是深度神经网络.
监督学习和无监督学习
机器学习分为监督学习和无监督学习,两者的主要区别在于数据有无标签.
监督学习:D=(X,y),学习X→y的关系,X为样本数据.
无监督学习:D=(X),寻找X中的特征或规律.以聚类为主
类型 | 算法 |
---|---|
监督学习 | 线性回归\逻辑回归\朴素贝叶斯\决策树\随机森林\svm\神经网络\ |
无监督学习 | PCA\K-means\GMM\LDA |
回归和分类
回归问题:输出的是连续性数值,比如温度,身高,气温等.
分类问题:输出的是定性输出,比如阴或者晴,好或者坏.
数据的特征\样本\标签
标签指预测值
特征是数据中属性
样本指数据
训练数据和测试数据
训练数据用来训练模型
测试数据用来评估模型
机器学习建模流程
Data source →数据预处理→特征工程→建模→验证.
Data source指数据,机器学习的基础
数据预处理:是对数据是对数据降噪.
特征工程:从样本中提取出有价值的信号.
建模:调参,改造
建模第一步是理解数据本身,切忌不要急于套用模型,因为不理解数据的情况下做出来的模型是由着很大的不确定性.
对于数据理解来说,最重要的一项技术叫做数据可视化(data visualization),如仅有一个特征的情况下,可以在二维空间中展示特征与预测值之间的关系.假如数据特征有2个以上,如何进行可视化呢?一,可以降维度,降到二维或三维空间;二,针对于每一个特征做可视化,以及观察特征之间的关系