什么是数据?数据科学家需要掌握哪些技能?终于有人讲明白了

640?wx_fmt=gif

导读:人们认为“数据”一词自16世纪伊始便已被定义和使用了。随着计算机技术的进步,数据一词变得越发流行。然而,数据不仅限于计算机科学和电子学领域,各个领域的应用在某种程度上使用并产生了数据。


各种数据源每天都产生大量的数据。这些数据源包括每日的交易数据,由传感器产生的数据,由上网产生的并存储在服务器上的数据,由用户产生的数据以及提供给用户的数据等。换言之,数据随处可见。在这些数据源中,网络数据源是最大的。


如果通过适当的技术使这些数据变得有用,那么这将为问题求解和决策制定提供很大的帮助。


作者:拉金德拉·阿卡拉卡(Rajendra Akerkar)

如需转载请联系大数据(ID:hzdashuju)


640?wx_fmt=jpeg



01 什么是数据?


数据是来自某个领域的原始观测值。原始数据是一组事实的集合,比如数字、单词、测量值,或者事物的文本说明。单词“数据”(data)来自于拉丁文“datum”,其含义为给定的事物。


数据是无处不在的,亦是事物测量仪器化的重要单位。所有的实体直接或间接地与事务相关,如商业中的客户、商业业务的组成部分,以及处理业务的外部实体,这些实体产生了大量的数据。


数据通常被看作是为了参考或分析而收集在一起的事实、统计资料和观测值。数据为推理和计算提供了基础。


数据既可以是定性的,也可以是定量的。定性数据的例子如人们描述一辆车多豪华,或者香水的味道(多么好闻的味道!)。


定量数据的例子如描述一辆车有4个轮子。后者关于车的例子描述了可数的物品,因此其本质是离散的。另一方面,“我的体重是150磅”是一个连续的定量数据的例子。树的高度、比赛花费的时间以及人的身高等也是连续的定量数据的例子。


640?wx_fmt=jpeg



02 数据科学


数据科学对不同的数据源进行系统地研究和分析,理解数据的含义,并运用数据作为工具实现有效的决策制定和问题求解。从这些数据中获取知识有助于组织机构在成本、交付和生产力方面更高效,确定新的机遇,并建立强大的品牌形象。


数据科学的目的是促进与数据相关的各种流程的应用,例如数据获取、清洗噪声的数据预处理、数据表示、数据评估、数据分析,以及数据创建相关知识的运用。数据科学在新方法分享、优化地管理和分析数据方面做出了贡献。


数据科学的目标是发现知识,这些知识有助于在个人、组织机构以及全球层面上进行决策。除了识别、收集、表示、评估以及利用数据来发现知识,数据科学亦促进了数据的有效运用,有助于在计算开销、质量和准确性方面进行优化。


可以想到,数据科学领域最终出现的机会便是大数据—通过分析由网络日志、传感器系统、事务数据生成的大数据,能够产生有效的洞察力并派生新数据产品。


640?wx_fmt=jpeg



03 现代商业中数据科学的重要性


尽管数据被称作新商业时代的货币,但是仅拥有数据是不够的。为了达到更好且有效地利用数据的目的,我们必须以适当的方式处理和分析数据来获取对某一特定领域的深入洞察力。特别地,当数据来自多个数据源时,这些数据不具有特定的格式,并且还伴有很多的噪声,那么就必须对这些数据进行清洗、整理、分析和建模。


  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值