互联网已经在我们日常生活的各个方面使用了很长时间。在这个高速发展的时代,为了更好的提高我们日常生活的节奏,必然会将很多事情应用到互联网上去解决。如,购物、销售、招聘、找工作等,不仅节省了不同的人力和时间,而且对整体流程效率和质量有更强的把握。
大数据的来源主要有三种:
1. 开放源数据。
开放源数据包括互联网数据和移动数据网络数据。网平台和移动互联网平台通过采集、汇编、开发或者用户互动等方式产生的数据,应当向社会公开,供网民或者用户查阅、浏览。
2. 运营数据。
运营数据来自于各单位的信息系统,尤其是外部信息系统之中,我们统称为业务系统。在目前的单位业务系统之中,存在于单位的OA系统或者CRM中,其中蕴含了大量的工作数据和交易数据,以及客户管理数据,包括交易 数据、流水数据、记帐数据、借款数据、贷款数据等业务数据,这些数据构建了每天的系统日志,同时又是帐户余额、信用额度、购买能力等的有力补充,这些数据不仅对生产系统起到计费支撑作用,同时也是用户(银行客户、电力客户、担保公司等)进行相关决策的重要基础,所以目前很多单位需要对这些数据进行查询统计和分析。
3. 线路数据。
无论是互联网还是各种外部网,任何网络行为都需要通过“线”进行链接和交互。而在这条线之上,要经过无数的路由交换才能完成,这条线路在完成链接的同时,也记录和存储了大量的数据,我们统称为线路数据。