人工智能学习
Python
利用Python解析数据集速度、效率方面比较轻量级!
- 轻量级指的是部署到服务器里面,可以提高服务器访问并发!
- 轻量级指的是业务与业务之间的逻辑性很强,兼容性很强、降低耦合度!
- 轻量级指的是业务与数据之间的一种关系体现很轻,简单说:获取数据集的方式很快、多样化
ssm、shh、ssi、ssp框架:
- SSM:(Spring+SpringMVC+MyBatis)框架集由Spring、MyBatis两个开源框架整合而成(SpringMVC是Spring中的部分内容)。常作为数据源较简单的web项目的框架。
- SSH:是 struts+spring+hibernate的一个集成框架,是目前比较流行的一种Web应用程序开源框架。集成SSH框架的系统从职责上分为四层:表示层、业务逻辑层、数据持久层和域模块层,以帮助开发人员在短期内搭建结构清晰、可复用性好、维护方便的Web应用程序。其中使用Struts作为系统的整体基础架构,负责MVC的分离,在Struts框架的模型部分,控制业务跳转,利用Hibernate框架对持久层提供支持,Spring做管理,管理struts和hibernate。
- SSI:(Spring+Struts+iBatis)SSI框架能够降低代码的耦合度,增强了代码的健壮性和可重用性,加快了开发速度,但是也有一些不足之处,比如由于三种框架的配置文件较多,也会带来了一些不便,特别是对于较小的应用来说更是如此。
- SSP:SSP模型是利用机器学习算法的容错性构建的一种并行计算模型,机器学习的容错性是指在误差容许的范围内,算法迭代计算过程中可以存在一定的误差。
引用自:
https://baike.baidu.com/item/SSH/5400403
https://baike.baidu.com/item/SSM/18801167
SSI
SSP
Java语言也可以实现人工智能的 操作数据 ----不建议 —重量级
- 重量级的操作,不适合"数据集的"采集操作
- 重量级操作不适合数据集的清理操作
- 重量级的业务与数据之间很难进行数据解析操作
机器学习
概念:
- 拟合: 构建的算法符合给定数据的特征 x?i? :表示第i个样本的x向量 xi : x向量的第i维度的值,指的是目标数据和预测数据几乎吻合。
- 鲁棒性: 也就是健壮性、稳健性、强健性,是系统的健壮性;当存在异常数据的 时候,算法也会拟合数据
- 过拟合: 算法太符合样本数据的特征,对于实际生产中的数据特征无法拟合,目标数据和 预测数据差距太大。
- 欠拟合: 算法不太符合样本的数据特征
- 机器学习需要 ----“思考”、
- 机器学习是一门从数据中研究算法的科学学科。
- 如何实现 “数据” 到 "算法"的过程?
数据采集(Python)、数据分析(Python)、数据挖掘(hadoop)、模型建立(算法)、预测未来(机器)
机器学习的算法公式思想
数据1: X轴 x1 x2 …xn
数据2: Y轴 y1 y2…yn
目标值: xn→…yn 误差趋近于0的时候就是目标值!误差最小—数据才能输出
结果公式D={(x1,y1),(x2,y2),(x3,y3)…(xn,yn)}= 输出结果
D ={(x1,y1),(x2,y2),(x3,y3)…(xn,yn)} ------------>“数据集”
g:x→y
备注 :g表示算法最终的公式,减少了数据集误差。
"数据集"就是一种算法的实现。
算法( T ):根据业务需要和数据特征选择的相关算法, 也就是一个数学公式
模型( E ):基于数据和算法构建出来的模型
评估/测试 ( P ):对模型进行评估的策略
训练数据
- 训练指的是一种学习行为--------转化为:“经验”-----通过经验采集的数据才是训练数据,训练数据时存在很大的不合理,并不能满足机器的学习使用。
- 数据集可以让机器学习使用!