*IT 2019展望:java转大数据及人工智能

1.java进入人工智能最好从Hadoop开始

1.1)人工智能核心是机器学习,

1.2)机器学习中有一块神经网络算法,独立出去就是现在很火的深度学习;

2.大数据有三个不同角度的定义

  1. “大数据”指的是所涉及的数据量规模巨大到无法通过人工在合理时间内达到截取、管理、处理并整理成为人类所能解读的信息。
  2. “大数据”指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理的方法的数据.
  3. “大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

3.大数据分析分为三个层次,即描述分析、预测分析和规范分析。

3.1)描述分析是探索历史数据并描述发生了什么(如探索是否成绩高的同学回答问题较多;)。

3.2)预测分析用于预测未来的概率和趋势(如根据学生回答问题的次数预测其成绩;)。

3.3)规范分析根据期望的结果给出指导(如预测其成绩从而指导学生回答问题的最优次数)。

  1. 人工智能分析时,不用猜测计算机会需要些什么方面数据,来辅助它。
  2. 计算机语言比人类语言更擅长特征分析,所以不要用人类思考的特征分析硬性概括。

4.为了高效:要有明确的直接目标而非间接目标。

更好的打广告:人工智能学习最好的广告排序。
更好的销售额:人工智能学习以销售额作为我们的目标值。
更好的画像:人工智能学习找出竞争品牌的画像。

5.类似玄学

有些有用的模型得出了结论。例如发现了血压对成绩有影响,这个是有用的,但是未必有一个明确的解释。

6.数据分析与大数据分析的区别(如预测学生学习成绩)

  1. 对于传统的方法来说,通过专家的分析确定需要什么数据,比如专家提出对学生成绩有影响的数据,包括出勤率、作业的完成率等,可以从数据源获取这样的数据;
  2. 大数据分析的方法有所不同,是找到所有可能相关的数据,甚至包括血型等,这些数据与成绩之间的关系未必有影响,就算发现了关系也未必可以解释。
  3. 再根据学习成绩与相关自变量因素,定义出线性回归的模型,最后对模型进行评估,检验这个模型是不是真的有效

7.技巧

排除一些相关的自变量,比如学生的起床时间和吃早饭的时间存在关联,在模型中可以只考虑其中之一,加快计算速度。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值