作业三:了解大数据的特点、来源与数据呈现方式

了解大数据的特点、来源与数据呈现方式

 

作业要求源自https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2620

 

 

1.分析所采用数据的来源有哪些?

 浏览了2019春节各种大数据分析报告,数据的来源大概分为以下几类:

  • 交易数据。包括POS机数据、信用卡刷卡数据、电子商务数据、互联网点击数据、“企业资源规划”(ERP)系统数据、销售系统数据、客户关系管理(CRM)系统数据、公司的生产数据、库存数据、订单数据、供应链数据等。
  • 移动通讯数据。能够上网的智能手机等移动设备越来越普遍。移动通信设备记录的数据量和数据的立体完整度,常常优于各家互联网公司掌握的数据。移动设备上的软件能够追踪和沟通无数事件,从运用软件储存的交易数据(如搜索产品的记录事件)到个人信息资料或状态报告事件(如地点变更即报告一个新的地理编码)等。
  • 机器和传感器数据。来自感应器、量表和其他设施的数据、定位/GPS系统数据等。来自物联网的数据可以用于构建分析模型,连续监测预测性行为(如当传感器值表示有问题时进行识别),提供规定的指令(如警示技术人员在真正出问题之前检查设备)等。
  • 互联网上的“开放数据”来源。如政府机构,非营利组织和企业免费提供的数据。
  • 人为数据即通过人类行为产生的数据。人为数据包括电子邮件、文档、图片、音频、视频,以及通过微信、博客、推特、维基、脸书等社交媒体产生的数据流。这些数据大多数为非结构性数据,需要用文本分析功能进行分析。

 

2.大数据的呈现方式有哪些?

 大数据一般借助于图形化的手段,清晰、快捷有效的传达与沟通信息。比较常用的呈现方式大概有以下几个分类:

  • 指标值图形化。(例如柱状、圆环和曲线图等)

  • 颜色可视化。

  • 关系图形化。

  • 关键词可视化。

 

3.大数据的特点是什么?对思维方式有何影响?

大数据的特点是大量化、快速化、多样化、价值化四种特点。

对思维方式有全样而非抽样、效率而非明确和相关而非因果三种影响。

  • 全样而非抽样。就是直接获取总体信息,不必通过样本参数去推断总体参数。
  • 效率而非明确。在样本=总体的大数据时代(有多少偏差就是多少偏差而不会被放大),快速获得一个大概的轮廓和发展脉络,就要比严格的精确性要重要得多。
  • 相关而非因果。因为无法控制无关因素,所以只能得到相关结论,而非因果。

 

4.python输入输出编程练习

  具体代码

下面为程序结果截图:

  

转载于:https://www.cnblogs.com/wuguoliang/p/11045478.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值