大数据和人工智能正在渗透并将改变人类生活

大数据分析实例:网络空间中的用户移动规律

首先,用户行为习惯分为两大类,一类是有迹可循的实际发生的数据,比如衣食住行等行为习惯,而“行”又作为一切行为的引发点,在物理空间中是可以通过分析人流习惯来规划城市,设计CBD,策划商业模式及行为等等。另一类是网络空间的数据生活,随着网络生活占据人类越来越多的时间,商业行为更多的转移到网络世界来已经是个不可逆的趋势,那么如何在网络世界中寻找用户的移动规律并更好地为用户提供服务?这是我们最近在做的一个工作。


研究物理空间中的人的行为、移动规律,通过手机及一些记录地理位置信息的东西可以来研究。比如滴滴,有打车的记录,可以看看早上人群是怎么流动,然后晚上人群是怎么流动。另外一个例子是春运,可以通过火车票、飞机票等来看这个人流的走向,能看出来有很多人是从外地来的,来到比如说深圳、北上广等城市打工的,那么春节他们都要回去,然后这些就能看出比如说广州的人都是哪儿的。这些数据对国家的交通、市政规划都是有影响的。

网络空间中人是怎么流动的呢 ? 从类比的角度去看,我们的地点对象就是各种社交平台。真实世界的地点也有公共场所和私密空间,在网络空间这个形态里也能找到同样的东西。比如微博,就相当于一个公共场所,谁都可以去看。再看微信,可能就比较私密。有的东西是开放给所有人的,而有的人就拉个小群,就只开放给某几个人,讲一些比较私密的事情。

我们可以看出一个规律,发现一个有意思的事情:网络空间的这些模式,跟物理空间很相像。就像物理空间吃饭的地方或者是锻炼的地方、家在哪里,当然你也可以去旅游的地方等等。那么网络空间里也有同样的东西,人每天去那么几个地方,你可以想象微信是你家似的,你可能去“今日头条”看看新闻等。可以在有限的这么几个常去的地方。人在物理空间都会回归到某个地方,我们发现人在网络空间也是一样。当然你偶然也会出差,或者旅游去其他地方。

所以我们在做的事情就是,把对物理空间的研究方法搬到网络空间来,同样挖掘网络空间里人的移动规律。我们还发现在网络空间里有一个现象,有的人喜欢探索,就会在网上到处看。而网络空间比较“宅”的人看的东西比较少,或者很长时间不改变。喜欢探索的人,有两种,一种是先到处看,然后最后选择几个点;还有一种就是开始不怎么看,然后越看越多,这两种模式都很有意思。

但一个有趣的地方是:物理空间中,你不可能同时在两个地方。现在多了个网络空间后,常规来说你也不能同时在两个地方。比如说你在网络空间里花很多时间,那你在物理空间多半是没动的。唯一 一个特例呢,想象是你在公交车上或是地铁,这个时候你人也在动,网络空间也在动。也可以想象你是一个点,你没动,是公交车在动。这个中间有个矛盾,就是这两个空间是互补的。我们想知道这些规律是不是一样,我们也在研究两个空间之间的关联性:知道在这个空间人的行为是不是就能预测到人在另外一个空间的行为。或者知道他现在在这个地方干什么,然后可能在那边就不可能干什么。随着研究的深入,成果将对如何去给用户提供更好的服务带来帮助,用途也非常广泛。 

大数据分析手段及工具 

大数据获取后,需要经过分析并从中得出规律才会转化为有价值的数据,大数据处理常用的方法有统计学、机器学习、数据挖掘方法等。

大数据分析传统的手段是统计,但是统计不是大数据分析,也就是说统计这个东西存在很多年了,但是从研究开发的经验来看,大数据分析光靠统计是不行的。现在的通常手段或者我们喜欢用的手段是机器学习,或者叫数据挖掘,机器学习和数据挖掘其实是差不多的,是和统计不同的一种方法,它基本上是一种学习手段,包括有监督学习、无监督学习等在内,而且具体要根据不同的问题采用不同的手段。

大数据最常用的机器分析语言有 Python、JAVA。Matlab也会少量应用于计算机视觉信息挖掘。我个人认为 Python 是一种针对大数据分析较好的语言,这是因为其处理文字比较强。其实现在大数据主要是文字和数字,当然很多大数据也有图像,但是图像的问题可以通过深度学习的方法变成结构化文字或者数字。深度学习大多数的软件都是 Python 写的。也就是说现在这个阶段,做什么样的大数据分析,用 Python 基本都可以搞定,所以常用的编程语言就是 Python。

常用的大数据分析软件不多,目前有一些统计软件比如机器学习、深度学习,五花八门,有的软件是民间开发的,有的是一些大企业开发的,像谷歌、百度、阿里巴巴等等,而且有不少是开源的。 

当大数据对现有行业的影响及用户普遍关注的安全及隐私问题

社交、消费和金融这些都是比较早应用大数据的行业,不乏成功的案例。我觉得下一步大幅应用大数据技术的是安防行业,就是跟维稳有关系的东西,如果你有充足的大数据,实际上人的行为是很清楚的。反恐、各种犯罪活动,包括金融犯罪,不一定是刑事犯罪,这些东西都可以去捕捉,这个是从社会安全这个角度来说。另外一个行业就是医疗,有人开玩笑说有几个东西是不靠谱的,比如百度看病,微信养生。但是这个只是说明现在我们的信息很杂,但不是说明这些平台本身不对,比如说微信,没准它真的能够发展成为跟养生、健康有关系的东西。是可以推动的,只是现在没有做到而已。现在不靠谱是因为各种人在里边把不可靠的消息转来转去。这个是属于“无政府”的状态,如果微信或者别的平台,利用大数据来做这个东西是完全有可能的。想像一下,有了大数据,不仅对一个个体,甚至是对一个群体都有一个更深的了解。凡是想对一个个体或者群体想做的事情都可以做得更好。所以从这点来说大数据对现有行业的影响是颠覆性的。

拿社交方面的典型应用微信来说,微信我觉得他做的很成功的就是,它变成一个像家的地方,你可以通过微信去干很多事情,比如说通过微信去打游戏,去支付,去发红包甚至像我们做学术,有人做生意也是这样做的。微信这个平台,之所以现在这么热,主要它是一个提供便利的信息交换的一个平台。人们可以发现用这个平台可以做生活中很多的事情。那么这个平台所谓的联系就很大,很多人都在上面。这个平台下一步可以做的事情就是,人在微信这个平台有各种各样的活动,那么我们可以收集到各种各样的数据,可以研究每一个用户的信息,进行用户画像,微信就可以推荐各种各样的产品、服务、或者社交机会、甚至是职业机会。它实际上掌握了大量个人的数据,把越来越多的东西都集成到这个系统中,那么最后基于微信平台的杀手级应用是肯定会出来的。

至于隐私和安全,这是个大问题,但是这个事情我是这样看的。有的事情你不是说担心隐私你就不去做。我觉得很好的例子就是移动支付。很多人一开始包括我都持怀疑态度。但是现在不是到处都在用嘛,大家好像也没有觉得这个少了钱多了钱或者是怎样。你在做的过程中这些供应商会想尽办法去解决隐私保护和信息保护这些东西。要不然就不会有用户。就是说这个需要会推动这个问题的解决方案。所以说不能是因为害怕这个负面的东西就不去做这个事情。而是说边做边改善。自然会找到隐私保护和安全保护的措施。所以说从技术的角度上,我不担心。可能现在没有一些方案,但是这些方案是可以去开发的。 

大数据分析正全面影响我们的衣食住行

我们的研究还涉及到多媒体,就是用一些人工智能的手段,用一些大数据处理的手段来分析社交多媒体的一些数据语言。最后我们就可以改进人生活的方方面面。社交多媒体是人工智能的一个很重要、很丰富的一个数据语言。

我觉得人在物理空间,他的关系就是跟别人的关系、跟物的关系,当然也有跟地点的关系。如果对一个人的兴趣、行为这些方式有越深入了解的话,那就可以提供更好的服务。物联网其实就是这样一个概念,生活中的这些器件可以通过网络联系起来,但这些器件最后都是跟人发生关系的,所以对人了解得越多,就越知道这些关系怎么去安排、怎么样给人提供最好的产品和服务。

我们团队的研究成果触及了人生活的所有方面,人的生活方面最基本的就是衣食住行,这个我们有涉及,我们更高级的需要除了衣食住行可能就是医疗,教育,娱乐等。包括可能有些人投资也是一种生活的需要。这些方面的研究其实我们都在做。

我就一个个说吧,比如说“衣”,我们做过大数据,从淘宝的大数据里面可以用计算机视觉和大数据分析的方法,分析为什么有的衣服很畅销,是因为领好,还是扣子好,还是说是颜色,还是花纹。这个我们目前都是自动的。这个在传统的时装行业是人做的。有人不断的看照片,然后找用户去问。这些都是非常低效的办法。网上的衣服五花八门,人的口味和趣味也是五花八门。不用大数据的手段,用人去做这个事情基本上是不能应付的。

“食”我们也做过。美国超市大都是连锁式。连锁店都有会员,会员每次刷卡其实购物的记录全部都在上面。那么这点中国也可以,比如以网购的方式来买菜,我们知道你买什么就会吃什么,这样的话就可以把你的饮食和健康,比如你肥胖、心脏病、糖尿病、眼睛不好等这些点关联起来。最后可以做成你手机的一个 APP,也可以跟超市一起合作,根据观察你的饮食情况,我认为你缺这个东西,或者你有可能吃太多某种食物,你应该改善,你应该买这个,这个等于就是把人的饮食健康水平提高。

“住”的话其实我们也做过。我们通过大数据看人住过什么样的酒店,再看这些住的人都是什么收入,什么文化,什么时候去等。这个时候就可以做一些推荐系统,比如说从另外一个地方到深圳来,根据他的消费习惯,承受能力,推荐一些住店建议。反过来呢,店家知道常来的客人是这样的,是不是可以提高服务、设施、尽量去满足这类人的需要,或者说这类人不是我想服务的人,那我可能要进行改进去吸引另外一类人。

“行”就是酒店可以考虑到季节性,很多人可能节后来观光,可以看出租车,公交车怎么去调派。这些其实我们都做过。

医疗我们做过很多事情,这里时间问题我就不讲了。社会教育方面我们也做过,就是把每个学生和导师进行一个关联, 推荐最适合的导师。总的来说,就是说人的生活的每个方面都可以运用大数据,就是说如果我们对每个人的兴趣爱好、性格、情绪情感了解得越多,那么我们就可以提供更好的服务,对社会也能提供更好的帮助。 

展望未来“智”生活

十年后的生活跟现在肯定不一样,二十年后更不一样。其实我认为都不需要十年,再过五年,我们看来就跟现在不一样。就拿移动支付来说,当然这个移动支付,不是人工智能的问题,他是一个技术的问题,这个技术改变了人们的生活习惯,现在的人大多时候都不用带现钱了。很容易大家就可以交换服务,交换付费这个事情。人工智能也是这样的,比如机器人,现在可能还不会做太多的事情,那以后,不仅可以带你小孩子出去遛弯,而且替你遛狗这件事情在不远的将来都能做到。但是这个机器人遛狗实际上是需要人工智能的,它要知道怎么走这个路,去到哪,怎么回来,如果这个狗乱跑怎么办,然后比如狗咬人了或者其他意外发生时它要怎么办, 所以机器人要有视觉,要能定位,要能观察这个狗有什么行为,这个狗和周围的人有什么交互,这些都是人工智能。为了实现机器人遛狗这个事,需要很多的人工智能。我认为未来五年内,就可以实现机器人遛狗这个事情。如果我们五年内做到这件事,你可以想象很多别的事情,比如说医院护理病人,护士辛苦是一方面,还有就是如果说病人他不能动了,有的护士没这个力气去搬动,还有搬的时候可能力气不够,高度不对,那可能造成对病人的损伤。但是机器人的话,如果能实现这些,可以实现把瘫痪的病人,或者需要我们扶的病人安全地搬来搬去,或者从一个房间走到另一个房间,现在其实美国已经有了这类机器,这个机器可以走到床边。这两个例子,我认为都是可以发生的,至于发生的形式是不是跟我们想象的一致倒不见得。比如说这个遛狗的机器人,是长得像个人,还是有轮子的,有脚的,这些都不重要。重要的是这个机器人可以遛狗,它具体的形态我们不容易判断,但是它的功能是可以预见的。

未来五年、十年、二十年,我们生活将会很不一样。人工智能会是很大的因素。正如移动支付这项技术正在改变着人类的生活,人工智能也会如此,包括机器人与环境、人机之间实现交互等更为智能化应用场景的实现,这些都是需要人工智能技术来推动。 

  Bingdata优网助帮汇聚多平台采集的海量数据,通过大数据技术的分析及预测能力为企业提供智能化的数据分析、运营优化、投放决策、精准营销、竞品分析等整合营销服务。

北京优网助帮信息技术有限公司(简称优网助帮)是以大数据为基础,并智能应用于整合营销的大数据公司,隶属于亨通集团。Bingdata是其旗下品牌。优网助帮团队主要来自阿里、腾讯、百度、金山、搜狐及移动、电信、联通、华为、爱立信等著名企业的技术大咖,兼有互联网与通信运营商两种基因,为大数据的算法分析提供强大的技术支撑。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值