人工智能入门(一)(大数据、云计算、人工智能和机器学习)

大数据

  • 大数据与云计算的关系密不可分,大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据的挖掘,但它必须依托云计算的分布式处理、分布式数据库、云存储和/或虚拟化技术。

  • 数据又并非单纯指人们在互联网上发布的信息,全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,也产生了海量的数据信息。

  • 大数据的价值体现在以下几个方面:(1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销;(2) 做小而美模式的中长尾企业可以利用大数据做服务转型;(3)面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值。

  • 大数据的四个特点:数据体量巨大、数据类型繁多、价值密度低、处理速度快。

  • 大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网和可扩展的存储系统。

  • 大数据中的数据分为三种:结构化的(有固定格式和有限长度)、非结构化(不定长和无固定格式)的和半结构化的(多半是XML或者HTML的)。


云计算

  • 云计算最初的目标是对资源的管理,管理的主要是计算资源、网络资源、存储资源三个方面。

  • 云计算具有两方面的灵活性(即弹性):时间灵活性(随时可以申请资源)和空间灵活性(可以申请任意数量资源)。

  • 私有云是把虚拟化和云化的软件部署在别人的数据中心里;公有云就是虚拟化和云化软件部署在云厂商自己数据中心里,用户不需要很大投入,只需要注册一个账号,就能在一个网页上点一下创建一台虚拟电脑。

  • Openstack已经成为开源云平台的事实标准。

  • 计算,网络,存储我们常称为基础设施Infranstracture,因而这个阶段的弹性称为资源层面的弹性,管理资源的云平台,我们称为基础设施服务,就是我们常听到的IaaS(Infranstracture As A Service)。

  • 除资源层面的弹性外,还要有应用层面的弹性,通常称为PaaS(Platform AS A Service),一般分为两部分,可以理解成:自己的应用自动安装和通用的应用不用安装。


人工智能

  • 物联网解决的是感知真实的物理 ;云计算解决的是提供强大的能力去承载这个数据;大数据解决的是对海量的数据进行挖掘和分析,把数据变成信息;人工智能解决的是对数据进行学习和理解,把数据变成知识和智慧。

  • 神经网络的普遍性定理:假设某个人给你某种复杂奇特的函数f(x),不管这个函数是什么样的,总会确保有个神经网络能够对任何可能的输入x,其值f(x)(或者某个能够准确的近似)是神经网络的输出。如果在函数代表着规律,也意味着这个规律无论多么奇妙,多么不能理解,都是能通过大量的神经元,通过大量权重的调整,表示出来的。

  • 人工智能算法多是依赖于大量数据的,人工智能程序通常作为SaaS(软件即服务,Soft As A Service)平台进入云计算。

  • 一般在一个云计算平台上,云、大数据、人工智能都能够找得到;对一个大数据公司,积累了大量数据,也会用人工智能的算法提供一些服务;对一个人工智能公司,不可能没有大数据平台支撑。


机器学习

  • 机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
  • 机器学习是人工智能的核心,是使计算机具有智能的根本途径,它主要使用归纳、综合而不是演绎。
  • 在算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。
  • 机器学习的广泛应用:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。
  • 基于学习策略可以分为六类:
    (1)机械学习(无需任何推理和其他知识转换,直接吸取环境所提供的信息);
    (2)示教学习(从环境获取信息,把知识转化成内部可用形式,并将新知识与原有结合);
    (3)演绎学习(所用推理形式为演绎推理,从公理出发,经过逻辑变换推导出结论);
    (4)类比学习(利用两个不同领域中知识相似性,通过类比,从源域知识推导出目标域的知识);
    (5)基于解释的学习(根据提供的目标概念、例子、领域理论和可操作准则,首先构造一个解释来说明为什么该例子满足目标概念,然后将解释推广为目标概念的一个满足可操作准则的充分条件);
    (6)归纳学习(由环境提供某概念的实例或反例,通过归纳推理得出该概念的一般描述)。
  • 目前机器学习领域的研究工作主要围绕三个方面:
    (1)面向任务的研究(研究和分析改进一组预定任务的执行性能的学习系统);
    (2)认知模型(研究人类学习过程并进行计算机模拟);
    (3)理论分析(从理论上探索各种可能的学习方法和独立于应用领域的算法)。
  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值