自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

summerhai

路漫漫其修远兮,吾将上下而求索

  • 博客(3)
  • 资源 (13)
  • 收藏
  • 关注

原创 Hadoop Pipes编程之C++实现WordCount

Hadoop虽然用java实现,但是同样可以支持其他语言的Map和Reduce。由于需要学习C++方面的Hadoop实现,所以最近一直在研究Hadoop Streaming编程,其中Hadoop pipes允许C++程序员编写mapreduce程序,它允许用户混用C++和Java的RecordReader, Mapper, Partitioner,Rducer和RecordWriter等五个组件,

2014-04-25 23:18:02 2041

原创 Hadoop中文词频统计

学习Hadoop都免不了WordCount,但是都是最简单的例子,而且都是以空格为划分的英文词频的统计,相比于中文,英文的统计显得简单很多,因为中文涉及到很多语义及分词的不同,通常不好统计中文词频,即使是现在的技术,也没有完全能符合人们标准的中文词频统计工具出现,不过现阶段还是有可以使用的工具的,比如IK Analyzer,今天就来尝试一下。先感谢看到的博客指导:http://www.cn

2014-04-13 14:35:24 5203 7

原创 MapReduce Job中全局共享数据的处理办法

在编写MapReduce程序时,经常会遇到这样的问题,全局变量如何保存?如何让每个处理都能获取保存的这些全局变量?使用全局变量是不可避免的,但是在MapRdeuce中直接使用代码级别的全局变量是不现实的。主要是因为继承Mapper基类的Map阶段类的运行和继承Reducer基类的Reduce阶段类的运行都是独立的,并不共享一个Java虚拟机的资源,因此,下面介绍三种在MapReduce编程中相对有

2014-04-13 10:18:46 2923

机器学习:实用案例解析(数据+代码)

机器学习:实用案例解析(数据 + 代码),英文版名称是“Machine Learning for Hackers”

2015-12-23

斯坦福大学自然语言处理公开课课件

斯坦福大学自然语言处理公开课课件,很详细的PPT

2013-12-16

斯坦福大学自然语言处理公开课课件汇总

斯坦福大学于2012年3月在Coursera启动了一个在线的自然语言处理课程,由NLP领域的大牛Dan Jurafsky 和 Chirs Manning教授授课: 以下是该课程的课件。

2013-12-16

cd-hit-user-guide.pdf 学习cd-hit新手必备!

cd-hit是非常快速的、是中国人(Weizhong Li)写的,很好用,最大的特点就是快。基本思路是首先对所有序列按照其长度进行排序,然后从最长的序列开始,形成第一个序列类,然后依次对序列进行处理,如果新的序列与已有的序列类的代表序列的相似性在cutoff以上则把该序列加到该序列类中,否则形成新的序列类。 指导学习cd-hit

2013-12-10

putty,可用于链接远程服务器

PuTTY是一个Telnet、SSH、rlogin、纯TCP以及串行接口连接软件。PuTTY包括了: 支持IPv6连接。 可以控制SSH连接时加密协议的种类。 目前有3DES、AES、Blowfish、DES(不建议使用)及RC4。 CLI版本的SCP及SFTP Client,分别叫做pscp与psftp。 内置SSH Forwarding的功能,包括X11 Forwarding。 完全模拟xterm、VT102及ECMA-48终端机的能力。 支持公钥认证。

2013-12-10

分享50个CSS超炫丽button样式代码下载

分享50个CSS超炫丽button样式代码下载,便于新手学习html css相关技术

2013-04-07

浙大android学习内部资料

这是浙江大学内部的android学习资料,对于初学者来说非常有用!

2011-12-15

android应用大量详细源码

大量android应用源码,适合初学者分析学习!适合建立小型android项目! 源码包括:1pictureviewer,2filebrowser,3contact,4taskmanager,5rockplayer,6AndroidWeatherForecast,7_android-mediaplayer,8_SpeakMessageService,9_CamMonitor,10_Snake,11android_dsgj,12MyCalendar,13CityWeather,14FileManager,15,MobileMap,16MusicPlayer,17MyContacts,18RingProfile,19TodayDate

2011-12-15

联想Android面试题

这是从联想招收android实习生里找到的面试题,希望能对学习android的人一点帮助~~

2011-12-15

Connector-j

MySQL Connector/J,包括 Chapter 1. Connector/J Versions Chapter 2. Connector/J Installation Chapter 3. Connector/J Examples Chapter 4. Connector/J (JDBC) Reference Chapter 5. Connector/J Notes and Tips Chapter 6. Connector/J Support Appendix A. MySQL Connector/J Change History Appendix B. Licenses for Third-Party Components

2011-11-17

Android远程登录

具有远程登录功能的Android源码,含有loading效果~~

2011-11-07

AndTripLog

AndTripLog 是一个 Android 手机上用来记录旅行中的位置、时间以及速度的软件。

2011-10-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除