大数据
文章平均质量分 71
白羊羊
最不像程序员的程序猿
展开
-
Ubuntu16.04+hadoop2.7.3环境搭建
转载请注明源出处:http://www.cnblogs.com/lighten/p/6106891.html 最近开始学习大数据相关的知识,最著名的就是开源的hadoop平台了。这里记录一下目前最新版的hadoop在Ubuntu系统下的搭建过程。搭建过程中发现一篇十分清晰全面的搭建文章,本文删减了一些不重要的内容,细化了一些内容。可以点击此处查看:原文。1.JDK的安装转载 2016-11-28 23:01:21 · 664 阅读 · 0 评论 -
Ubuntu 16.04 + Hadoop 2.7.2 全分布式搭建
最近读了吴军博士的《智能时代》,很想要学习大数据,正好选了云计算的课程,可以摸索前进。先介绍一下,Hadoop的三种分布模式:1. 单机模式:这种模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统。2.伪分布式:指Hadoop运行在一个计算机上,即当NameNode,又当DataNode,或者说既是JodTracker,又是TaskTracker。没有所谓的在原创 2016-12-05 19:08:05 · 2149 阅读 · 0 评论 -
推荐系统中的同现矩阵问题
最近在研究Hadoop大数据方面的知识,正巧看到了推荐系统,其中里面有个同现矩阵很是让我蒙圈,查了很多blog之后,写下来与大家分享。1.建立同现矩阵的过程在协同过滤算法中同现矩阵的建立是极其关键的一部,原始数据如下:1,101,5.01,102,3.01,103,2.52,101,2.02,102,2.52,103,5.02,104,2.03,101,2原创 2016-12-07 15:35:35 · 2651 阅读 · 0 评论 -
一些常用SQL语句大全
原文出处:http://www.cnblogs.com/acpe/p/4970765.html一、基础1、说明:创建数据库CREATE DATABASE database-name2、说明:删除数据库drop database dbname3、说明:备份sql server--- 创建 备份数据的 deviceUSE masterEXEC sp_转载 2017-02-20 15:04:20 · 293 阅读 · 0 评论