数据处理
laymenISmouse
这个作者很懒,什么都没留下…
展开
-
R入门知识学习
R是最受欢迎的数据分析和可视化平台之一,2011年R随着大数据的爆发而流行起来, R是免费的,开源的,支持windows/Mac os/Linux平台 R可以挖槽数据分析涉及的几乎所有步骤:从数据获取到数据清洗到数据分析到结果报告 https://www.kaggle.coms 数据分析包括: 1、探索性数据分析 a、数据分析中必要步骤 b、了解数据 c、作图 2、统计推断原创 2016-02-04 13:02:58 · 915 阅读 · 0 评论 -
Hadoop之Hive学习
Hive是构建在hadoop HDFS上的一个数据仓库 数据仓库:是不可更新的,随着时间的推移,不产生变化的集合,主要是数据查询,用于决策的数据。 Hive允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作. 是SQL解析引擎,他将SQL语句转移成M/R Job然后在hadoop执行。 Hive的表原创 2016-02-03 21:27:14 · 598 阅读 · 0 评论 -
hadoop2.7.3 mahout 0.9 遇到问题
hadoop2.7.3 mahout 0.9 遇到问题: 以命令行提交hadoop任务,VMware10虚拟机,ubuntu16.4,单机版hadoop2.7.3,mahout0.9,maven3.3.9 处理数据ratings.csv;原创 2016-10-01 10:25:44 · 1081 阅读 · 0 评论