Hadoop Mapreduce从零开始

渣渣程序员一枚,初学hadoop,将各位大神的博客整理一下,加上一点自己的小demo。欢迎拍砖

2014-07-16 18:40:08

阅读数:1019

评论数:0

Nginx从零开始

Nginx从零开始 转至元数据结尾 转至元数据起始 Nginx学习前置条件 linux入门 http://www.92csz.com/study/linux/  看到前九章就够用了,之后的章节后续再边学边看。 了解...

2014-07-09 09:01:28

阅读数:780

评论数:0

C++ unordered_map

unordered_map,可以看做是一个哈希映射,

2014-07-22 20:13:59

阅读数:648

评论数:0

NLP一些基本概念初识

TF*IDF 在一份给定的文件里,词频 (term frequency, TF) 指的是某一个给定的词语在该文件中出现的次数。这个数字通常会被归一化,以防止它偏向长的文件。(同一个词语在长文件里可能会比短文件有更高的词频,而不管该词语重要与否。) 逆向文件频率 (inverse d...

2014-07-18 15:53:13

阅读数:1316

评论数:0

linux awk详解

AWK是一种优良的文本处理工具,Linux及Unix环境中现有的功能最强大的数据处理引擎之一。这种编程及数据操作语言(其名称得自于它的创始人阿尔佛雷德·艾侯、彼得·温伯格和布莱恩·柯林汉姓氏的首个字母)的最大功能取决于一个人所拥有的知识。AWK提供了极其强大的功能:可以进行正则表达式的匹配,样式装...

2014-07-17 16:30:05

阅读数:437

评论数:0

linux screen

系统管理员经常需要SSH 或者telent 远程登录到Linux 服务器,经常运行一些需要很长时间才能完成的任务,比如系统备份、ftp 传输等等。通常情况下我们都是为每一个这样的任务开一个远程终端窗口,因为它们执行的时间太长了。必须等待它们执行完毕,在此期间不能关掉窗口或者断开连接,否则这个任务就...

2014-07-16 17:36:37

阅读数:496

评论数:0

多服务器文件自动同步inotify+rsync

文件同步 转至元数据结尾 Created by zekun.zhu on 五月 29, 2014 转至元数据起始 文件同步方案 前提 免密钥登陆线上服务器 A为本地主机(即用于控制其他主机的机器) ; B为...

2014-07-08 14:14:45

阅读数:992

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭