secondary sort

class FirstPartitioner extends Partitioner {     @Override     public int getPartition(Text key, MapWritable value, int numPartitions) {       Str...

2012-03-30 14:13:54

阅读数:570

评论数:0

最近有点小烦

因为工作以来一直没有怎么接触过模型或者算法的东西,整天做的就是零零散散的工程,一直以来我都忍了。可最近这个季度,回头看来,去年年底计划的工作都没做,全改变了,又回到了工程的东西了。所以我挺烦的,说实话,我不care工程上代码写多好,也不care工程上什么新功能。我只care的是效果和算法,我对这感...

2012-03-30 08:03:53

阅读数:438

评论数:0

主题抽取和推荐的联系和差别

我们经常会看到,很多文章在对数据做聚类或者分类,也就是说从数据中抽取出主题或者兴趣,这个是一个概括的过程。 而推荐则是一个预测的过程,即我已经知道你对A感兴趣,虽然你目前没有关注过B,C,D,但是基于关联关系,我觉得A和B关系很密切,和C关系较密切,和D关系一般密切,这完成了预测。而后是推荐过程...

2012-03-28 22:48:17

阅读数:571

评论数:0

matrix spectral, matrix factorization, lda, pca, spectral clustering

最近打算把这几个好好看看。 最近一直做工程做的比较烦,热情也减低了,所以其余时间多看文章,总结一下,准备实现一个模型看看效果。

2012-03-28 18:06:34

阅读数:542

评论数:0

Job Setup: Failed

Job Setup: Failed tmd,我郁闷死了。我又把这个搞错了。上次是因为写了一个路径,该路径是hadoop生成的,我不记得了。我的用户名写不了。今天又是这样的。事不过三啊。

2012-03-23 15:28:19

阅读数:608

评论数:0

configuration

唉,我又犯了低级错误。把configuration用new configuration()来处理了。这样的话,test case中传入configuration时就总是传不进去啊。并且通过job传进去的configuration常数也不能工作。

2012-03-23 13:42:45

阅读数:401

评论数:0

vimtutor

^              k              提示︰ h 的鍵位于左邊,每次按下就會向左移動。                       l 的鍵位于右邊,每次按下就會向右移動。              j                     j 鍵看起來很象一支尖端方...

2012-03-22 08:04:19

阅读数:288

评论数:0

vim常用命令

来自豆瓣网友:http://9.douban.com/site/entry/125947350/ 插入操作 “i” — 从光标所在位置前开始 “I” –光标移到当前行的行首,然后在其前插入文本 “a”– 光标当前所在位置之后追加新文本 “A” –命令将把光标挪...

2012-03-22 07:58:11

阅读数:319

评论数:0

vim使用

原文地址: http://linuxtoy.org/archives/efficient-editing-with-vim.html 虽然从很久前就开始用 VIM 了,但一直都是半调吊子,翻来覆去只用自己会的命令。最近为了提高书写代码的效率,还有 coding 时候的乐趣,又重新钻研了一下 ...

2012-03-22 07:56:56

阅读数:290

评论数:0

Integer.valueof Integer.parseOf

从java api上可以看到。两者的区别。 static int parseInt(String s, int radix)            Parses the string argument as a signed integer in the radix sp...

2012-03-21 11:41:21

阅读数:1019

评论数:0

服务器设置

其实,我没有配置过服务器,是别人把服务器搭好的,我自己去用的。 所以,只说怎么用吧。首先要设置网络socket,连接到服务器端口上。然后按照规则给服务器传数据并接收数据。 我是架设了两个公司用的模型服务,感觉用起来还是很好的。只是,目前是单机版的,所以下一步是搭建多线程的吧。看...

2012-03-20 15:04:10

阅读数:356

评论数:0

编程习惯for while

http://stackoverflow.com/questions/3875114/why-use-a-for-loop-instead-of-a-while-loop 尽量用for 但是如果你无法确定是有多少循环时,用while是很好的选择啊。

2012-03-20 13:50:52

阅读数:390

评论数:0

改文件名称

在文件test中有文件,名字是以tck-r-00000等这样的字段结束的,是mapreduce的job生成的。 我现在要把文件的名字中间添加上时间标签。 baseDir=/opt/test/ ls $baseDir | while read NAME do   tmp="${N...

2012-03-13 16:22:17

阅读数:475

评论数:0

hfile到hbase

去年年底留下的一个问题,我当时查找错误时,就觉得这个问题肯定是我使用的方法不对,绝对不是hbase的bug。可当时大家都要保证稳定过年,所以也就没有找人帮我来查找这个问题。 具体是我将大文件通过写入hfile,然后再load到hbase中。但是我发现hbase中几乎没什么key valu...

2012-03-10 16:14:51

阅读数:859

评论数:0

java中getTime()

java中getTime()返回的是毫秒单位的long数据。因此,在转换为时间时需要注意。 一般时间以1970-01-01 00:00:00为参考点,但是注意看看是否需要时区。如果是cn,那么加上时区影响,是1970-01-01 08:00:00为参考时间。

2012-03-07 18:23:15

阅读数:25345

评论数:0

bug

我今天一天开了两个issue,都是bug类型的。我郁闷。 一个bug是原来的遗留问题,不能算我的bug。不过我在接项目时,没有去仔细想,这是我的责任。 另外一个bug是当时赶的太紧了。过滤时漏掉了一个参数。哎。 所以说,我最近就在不断的修复bug了。

2012-03-06 16:26:28

阅读数:453

评论数:0

cygwin的部署

因为看到同事在windows下用cygwin,我决定无论如何要安装上。 基本上靠google完成了部署和安装,然后在部署ant时,又忘记把path添加到bin级别了。于是乎,又问了一次同事。吼吼,总算搞定了。 用着感觉比xshell用着舒服多了。很有ubuntu的感觉。

2012-03-06 11:21:57

阅读数:479

评论数:0

一个bug至今没有fixed

程序中,不知道是什么地方存在bug。是这样的,我在生产环境下运行时,总是会出现丢数据的问题。可如果我跑了一遍后,再运行一遍就没问题。这是个奇怪的问题吧。 曾经试验过,在生产环境下,另外运行一次,也不丢数据,用我自己的用户名运行一次也不丢数据。但是如果在生产环境下第一次运行就会发生丢数据的现象。 ...

2012-03-05 10:36:49

阅读数:548

评论数:1

svn propset

svn propset reviewboard:url http://reviews.corp.mediav.com .  出现信息:  设置属性 “reviewboard:url” 于 “.” 出现这个后,我很奇怪,还以为出错了呢。吼吼,问了两个同事,牛人说这不是错误信息...

2012-03-01 14:04:39

阅读数:3107

评论数:3

提示
确定要删除当前文章?
取消 删除
关闭
关闭