大数据时代,互联网企业的核心技术是什么呢?
在回答这个问题之前,我想先说明一下:我是一个完全的互联网门外汉,工作之后,逐渐的关注互联网及相关公司的发展,也算小有领悟。所以我试着从一个普通人的角度来回答这个问题! 如有差错,欢迎指正。如下:
首先我们要搞懂什么叫做大数据,我的理解是:基于互联网用户的行为记录。这句话可能比较难理解,举个例子来说,我今天在百度上搜索“商标注册”,那么我的这个行为就会被百度的后台或者响应的设备记录下来(包括我搜索的时间、次数等),如果我在连续的几天都在搜索上述的东西的时候,比如点击次数达到某一个峰值,我这些连续的行为通过计算分析以后显示我有这方面的需求,这不,商机就出现了。这个可能还是比较抽象,我再举一个例子,就是我每天都会通过新浪的新闻客户端看新闻,而我关注的新闻不在乎这样几类:财经、互联网还有就是足球。对于那些“某小三疑被原配扒光衣物揪着上大街”等新闻我是直接pass掉。这样我每次看新闻的时候点击的都是上述几个领域的链接,一段时间以后,我发现,我的新浪新闻客户端向我显示的新闻大概有80%都是我喜欢的上述几个类别的(相信经常看新闻的同学应该也有这个感受),而当我用同事的手机登录去看的时候,显示的新闻除了几大头条略同之外,其他的则有很大区别。我想,这大概就是新浪通过对我通过手机客户端浏览新闻点击的行为做了记录之后做出的反应。其中的原理我试着解释一下,首先,新浪的服务器或者后台通过对我手机的识别并做出标记,并通过一定时间对我的网络行为进行记录以后,再将我感兴趣的新闻排序提前,让我能省心便捷的浏览我喜欢的新闻。当然也许过程或者原理可能更复杂一点,而且我上面举的两个例子都比较简单,可能会有更复杂的场景,但基本的原理应该相差不大。那么,通过上面我讲的这两个例子,我可以来回答这个问题了,在这个时代,互联网最重要的技术就有:数据的收集与存储、数据的整理与分析、数据的反馈与修正(排名不分先后)。当然,如果非要指出一个核心的东西,那我认为是数据的整理与分析,因为这是将数据转化为商业应用最重要的一环,而且最为复杂,比如计算的公式怎么来确立,技术参数怎么设置,不规范的数据怎么处理等等。
以上是我这个门外汉的一点思考,想到哪里就写到哪里,如果有行家看出问题不要见笑啊!
(备注:这是我在知乎回答的第一个问题,因为之前在知乎看了那么多的回答,觉得这里真是一个高手云集之地,看到的几个问题都不敢冒然作答,但今天终于迈出这难得的一步,希望大家多指正,如果觉得对知友有帮助的话记得点个赞哈,这将激励我这个新手昂然前行)