赵淦森博士的讲座分享整理No.32

我是小蕉。

先稍微介绍一下赵老师哈。

赵淦(gan)森,计算机安全博士,毕业于英国肯特大学。在英国期间曾任英国Nexor公司的兼职高级安全技术顾问、甲骨文英国(Oracle UK)终身高级工程师。现任华南师范大学计算机学院教授、广东省服务计算工程中心副主任。

本篇博客主要整理赵老师于2017年7月20日的讲座分享,主题是《重新认识人工智能、云与大数据》,觉得很有价值,所以记录下来并分享给大家。

第一部分聊聊云计算

什么是云计算?云计算主要解决什么问题?云计算其实主要解决下面三个问题。

第一个就是大资源管理。

非常多非常多的物理资源,要如何把它们管理起来?如果说只有十几台或者几十台机器,那么一个运维团队可能可以日以继夜非常努力去保证他们的稳定性。但是现在一般的集群少则几千台,甚至google的资源有几百万台,需要怎么去管理呢?

而且每台机器都是很不可靠,资源很小很小很局限的。同一个软件要分发到这么多机器,要怎么提高效率?这么多机器的资源如何集合,如何维护,都是一个很大的需要去解决的问题。

一般来说如何管理呢?

首先要做的两件事情就是,资源与能力分离以及标准化。

拿移动硬盘距离,硬盘里的一部电影就是资源,资源要怎么提供给我们呢?只能把硬盘直接拿到我们自己的电脑上,然后再进行拷贝。在这里资源和能力是强绑定的,完全不可分的,这就不太可能把资源管理起来了,所以第一件事就是要把资源和能力给区分开,现在的方式是通过网络和资源管理软件来实施。

说到网络,有很重要的东西就是SDN网络,传统意义中一个子网可能最多就支持1024个IP,那么如果几个集群有上万上百万的节点,要如何把它们连接起来,SDN是一个还不错的解决方案。

标准化又是怎么一回事呢?这么多规格的资源,怎么统一管理,最好的一种方案就是进行标准化。每个机器都进行标准化,提供一模一样的服务方式,这样子在管理的时候,就能很容易进行资源和能力复制了。

第二个问题是大能力构建。

有了这么多资源,要如何把它们应用起来,传统的处理方式都是单机单节点模式,那么遇到一些非常大规模的计算问题的时候,就会显得非常乏力,特别是现在互联网这么多数据,已经达到了ZB级别,而且还在不断爆炸。

如何在可以接受的时间范围去处理这这么大量数据,已经成了一个很大的问题。需要我们去设计一些资源,一些系统来进行这么大数据量处理的能力的构建。

现在比较主流的方式就是分布式计算。比较典型的有两种,一种是负载均衡,一种是MapReduce。负载均衡可以解决机器不可用的稳定性问题以及服务的横向拓展问题,MapReduce可以进行计算能力的分布式。有了这两个框架,可以实现绝大多数的大能力构建。

第三个问题是大能力交付。

资源管理起来了,大计算能力也构建起来了,如何把这些能力交付给目标用户,也是一个很大的问题。光有这么大能力,只能管理员自己使用,这不是云想解决的问题。云最重要的作用就是把这么大的能力,无差别或者有差别地,提供给需要这些能力的用户。

怎么解决多租户问题,思路是这样的。首先每个租户的资源都是非独占的,不使用的时候要释放资源。做到了每个租户非独占之后,才能做到资源的统筹管理。所有的资源都是虚拟的,进行池化,所以就可以一次性提供超过一台机器极限的很大资源。

上面就是云计算解决的问题。

云计算中有一个很重要很重要的解决方案就是虚拟化。目前比较主流的技术就是虚拟机和Docker技术了。虚拟机主要作用就是是在宿主OS上面虚拟出自己的OS,无论在什么物理环境上,都可以虚拟出需要的OS。而Docker则是使用宿主主机和主机的OS,使用Docker引擎进行资源归一化,然后在上面虚拟出很多的app。

虚拟化有什么好处呢?

1、资源分割。

一台主机可以初始化N个虚拟机,提供给很多的用户使用。

2、资源隔离。

不同虚拟机和应用之间,是完全隔离的,一个用户把环境搞崩了不会影响到其他的用户。

3、同质化。

经过了虚拟化,所有的资源对于用户和云平台来说都是同质的,无差别的可以提供同等服务的机器。

4、运维自动化。

同质化了之后,运维自动化也开始变得可能起来,一个更新可以通过工具,批量地发布到很多很多的机器上。

5、交付自动化。

所有资源都进行虚拟化了,那么就可以使用固定的程序进行资源和能力交付,这能极大地较少运营和销售人员的时间。

第二部分聊聊大数据。

很多人都以为大数据就是很多很多的数据,几百个G几百个T,就大数据了吗。

马云的一句话说的其实很好,大数据,大是指大计算,数据是指云数据。使用大数据思维的一些方式,借助大数据工具去做一些分析,才能算大数据。

那么大数据思维和传统的科学思维有什么差别呢?

传统科学基本都是基于实验的,首先定义一个正确的过程,经过这个正确的过程,就能准确地推导出正确的结论。一切都是要保证过程的正确性。

比如说,要研究一个问题,研究什么情况下需要打伞。传统的想法可能是,看一看天识别一下下雨概率,加很多传感器测量一下目前在身上的雨的大小,装一个盆子在头上测量一下雨量,然后还要区分一下现在在什么地方是不是需要打伞。

如果用大数据的思维呢。大数据挖掘出一个结论,旁边的人都打伞你就打伞。

在使用大数据的方法之前,要有一个认识,要认可过程的多样性。要用上帝视角去观察事物,过程未知也未必不可,只要保证结果在绝大多数情况下是准确的就可以了。

在使用大数据的过程要注意什么呢。最最最重要的,就是耀进行大数据治理,数据质量要有保证,不然就只能是垃圾进垃圾出,Garbage In Garbage Out(GIGO)。保证数据可用,好用,有用。

第三部分聊聊人工智能。

人工智能这个概念,是约翰·麦卡锡(John McCarthy|1956在达特矛斯会议提出的。大概分为下面好几个派别吧,还有很多其他派别。

符号主义->以规则为主导,总结很多的逻辑推导。

联结主义->模仿人脑神经元的思考方式。

贝叶斯主义->主要基于概率图模型。

行为主义->进行仿照自然界的原理,比如遗传,模拟退火等等。


讲座分享到这里就基本结束啦,总得来说赵老师的分享大局观非常非常好,对于很多问题也是能把这些关键点一个一个拆开,虽然没有涉及到很多具体的技术,但对于这些东西也算是有一个比较好比较清晰的理解吧。

那么对于我们普通的个人,要怎么做去适应这个时代变革呢?

只有一个目标:把它们利用起来。

用各种云来解决我们的服务器问题,用大量的算法和论文来充实自己的理论基础,用大量的开源框架解决我们的应用落地问题,就够了。

慢慢来,潜心学习,未来还是我们的。

最近不知道分享啥吖,没什么互动,没有赞赏没有动力吖。

好惆怅啊,大家帮我支支招吖。

再不行我又要啃老本了。

不赞赏没动力了吖各位看官老爷

0?wx_fmt=jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值