自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (5)
  • 收藏
  • 关注

原创 Hadoop之Text与String的异同

String 常量,创建之后不可修改 字符串连接是通过StringBuilder(或StringBuffer)类实现的 【区别:StringBuilder是非线程安全的,这也使其性能比StringBuffer要高(少synchroned方法)】 String: UTF-16格式 Unicode 为解决传统字符编码方案的局限而产生 Unicode方案包括: 给所有字符指定一个唯一对应的数字 将字符

2017-03-04 20:47:14 1478

原创 Hadoop实战之课后题--分析web服务器的日志文件

任务 统计每个IP地址的访问次数 查找访问数最多的前K个IP地址 分析: 任务1很简单,简单的求和问题,用来重新熟悉hadoop MR程序的写法。 优化:使用combiner()减少网络中的流量传输; 这个例子中combiner和reducer的逻辑相同,两种使用同一个reduce即可。 代码贴在附录里了,注释详细,可查看~ 任务2是一个TopK的问题,要点有以下几个: 使用TreeMap来得到

2017-03-03 16:34:09 856

转载 Linux下打包运行MR程序

转载自 使用命令行编译打包运行MR程序 网上的 MapReduce WordCount 教程对于如何编译 WordCount.java 几乎是一笔带过… 而有写到的,大多又是 0.20 等旧版本版本的做法,即 javac -classpath /usr/local/hadoop/hadoop-1.0.1/hadoop-core-1.0.1.jar WordCount.java

2017-03-03 10:38:23 1268

转载 JAVA学习路线图

转载自byrbss  JAVA学习路线图 以下是原文: Java是一个通用的编程语言,其实可以干很多事,怎么学Java就看怎么用了。 但有一些一般的步骤: 1. 熟悉一种文本编辑器,比如Vim, Emacs, Notepad++, TextMate等。知道哪些是开源的,哪些是闭源的,哪些要收费。养成不用盗版软件的习惯。 2. 安装JDK(建议用你的Linux发行版

2017-03-03 09:12:31 633

转载 Hadoop_eclipse开发配置

参考这两篇文章 http://www.cnblogs.com/xia520pi/archive/2012/05/20/2510723.html http://www.cnblogs.com/simplestupid/p/4681144.html

2017-03-02 16:43:16 381

xgboost原理

xgboost作者陈天奇对xgboost原理的介绍,讲得很好,真的超级好!~~~

2016-11-30

kaggle比赛HousePrices之数据预处理

kaggle比赛HousePrices之数据预处理部分的完整代码,包含非常详细的注释,属于数据挖掘预处理的经典流程性代码。

2016-11-08

最近邻算法实现

参考<>一书第二章k近邻算法, 第二节【使用k近邻算法改进约会网站的配对效果】所写成。

2016-06-24

kdd2014论文集

kdd2014论文全集

2016-05-23

ViewPager仿微信分页导航,多Activity载入

基于android的源码。利用ViewPager实现的仿微信分页导航,多Activity载入

2014-09-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除