一、大数据
定义:指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
主要应用:公共安全、医疗健康、城市规划、移动应用、电子商务、定向市场营销、情感分析、设计网络、体育运动、吸引力挖掘……
二、数据挖掘
数据挖掘:自动从大量的、完整的和嘈杂的数据中自动地提取隐藏其中的有趣以及有用的模式。
主要应用:商务智能
三:数据挖掘技术——分类
分类算法:决策树、KNN、神经网络、支持向量机器……
主要应用:医学诊断、用户分析……
交叉验证:
混淆矩阵:是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。具体评价指标有总体精度、制图精度、用户精度等,这些精度指标从不同的侧面反映了图像分类的精度。在人工智能中,混淆矩阵(confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵。在图像精度评价中,主要用于比较分类结果和实际测得值,可以把分类结果的精度显示在一个混淆矩阵里面。混淆矩阵是通过将每个实测像元的位置和分类与分类图像中的相应位置和分类相比较计算的。
代价敏感学习:机器学习中解决一类判别问题的理论与方法。该类问题中不同类型的判别错误往往会导致显著不同的损失。
四、聚类(无监督分类)
线性回归:线性指的是参数与变量之间的关系是线性的,而不仅仅是线性函数。
五、云计算
- 即用即付费
- 软件即服务
- 平台即服务
- 设施即服务