数据科学浅谈

一.数据科学含义
1.数据科学核心任务是从数据中抽取信息,发现知识,提炼和挖掘价值。
2.数据科学是以各类数据作为研究对象,对数据进行分析和挖掘。
3.大数据特点:数据量大、数据种类丰富、速度快。
4.数据中蕴含着规律,这就是大数据的价值所在,而发掘这些规律和价值的过程需要一些数据分析和处理的方法和技术。
5.数据就是一种原料,大数据对于没有原料加工和处理能力的公司而言,无疑就是一堆垃圾,而对于大数据科学家而言,可能就是变废为宝。
6.对于数据科学家而言,需要数据可视化、数据挖掘、统计分析、机器学习等数学基础。
7.数据分为结构化数据(包括标注数据)和非结构化数据。

二.数据科学的原则
1.总结过去(描述性任务,从历史数据中发现隐藏的规律,诊断分析原因,适合用统计分析的方法来做)和面向未来(通过机器学习的回归分析技术和方法帮助我们去预测;还有规范性分析)
2.计算实体间的相似度是我们进行数据分析和处理的基本也是非常重要的途径和方法以及角度。
3.相关性不同于因果性,前者是统计角度,后者是逻辑上的概念;比如我们听见雷声和看到闪电是高度相关的,但两者并无因果关系。而其中的原因是忽略了干扰因子即额外因素的存在,参照因果论。
4.能够并行处理和分析大数据。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值