![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据科学与大数据技术
Melody袁
这个作者很懒,什么都没留下…
展开
-
hadoop3.2.1和java1.7版本不兼容解决方案(virtualBox下ubuntu环境linux系统)
我是按照厦门大学实验室官网的安装教程进行安装配置的,先配置了jdk的环境是1.7的,然后下载hadoop安装包的时候看到最新版本的是3.2.1于是就直接下载了,安装完后输入命令查看hadoop是否可以使用,如果成功的话直接会显示版本信息,但是报错了: 在网上搜索了下,没有找到和我有同样问题的人,但是有类似的报错在java编译中出现,错误的原因是jdk和jvm版本不一致,检查完后发现是一致的,于是...原创 2020-03-05 13:49:24 · 848 阅读 · 4 评论 -
数据科学项目(二)之明确问题及确立目标
一个规范的数据科学项目必须起始于问题的确定,我们首先必须明确问题是什么,然后根据问题制定目标,然后才能设计和执行后续步骤。 问题和目标都涉及两个层面: ①用户层面 现实中的具体问题 针对用户的具体问题,我们应该做好充足的背景调查,然后制定出相应的用户层面的目标。 案例一:某银行对他们的不良贷款率不满意 ????希望降低不良贷款 ...原创 2020-02-08 13:23:03 · 1071 阅读 · 0 评论 -
了解※数据科学※(一)之数据的概念及一个数据科学项目的流程分析
一、基本概念 数据: ①传感器采集到的各种物理、生物、化学指标等等各种可记录,可表征的数量,性质都是数据。 ②现实中某种事物或事物间关系数量或性质的表征和记录,都称之为数据。 ③信息的载体。 大数据 大数据(big data,mega data)或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。----来自百度link 4V特点: Ⅰ...原创 2020-02-06 22:04:56 · 747 阅读 · 0 评论