- 博客(9)
- 资源 (8)
- 收藏
- 关注
原创 备忘
http://digitalmarketing-glossary.com/What-is-Look-alike-targeting-definition各种电子商务方向的知识,备忘一下。
2013-07-29 17:14:49 719
原创 svn删除文件恢复
不小心svn delete了一个文件夹,文件夹中的文件也没有了。可这个是新建的,写了那么多东西都没有了。找了一下,发现还是有办法的。建一个同名的文件,然后local history下,show history,然后找到相应的历史文件,拷贝一下就行了。
2013-07-29 16:11:29 2136
原创 code convention
最近要重点关注的:java code convention养成良好的编程习惯,能大大提高工作效率,不能再因为这些问题让自己一遍又一遍修改code,浪费了自己的时间,降低了效率,真是不值得。
2013-07-29 13:25:19 1384
原创 mrunit测试
mrunit是干什么的?为测试hadoop用的。其中很多功能是无法测试到的,需要写mock。而对于多输入吧,mapreducerdriver又没有办法setmapper,所以很是麻烦。同事吧,如果你的key是一个keyvalue对,测试起来也很麻烦。以前是同事从写了其shuffle功能,1.0的版本提供了这个。可以直接用mapreducedriver的这个shuffle功能实现
2013-07-25 14:02:13 801
原创 svn
svn changelist clfile xx.java,xxl.javapost-review --svn-changelist=clfile
2013-07-23 17:03:06 566
原创 工程备忘
动手能力还是需要提高啊……在工作中,老是需要写入到文件吧,分文件类型备注一下吧。报警文件:这个一般是存在fatal或者error的时候才有写入的,因为需要报警,需要人为查看。因此,需要及时报警。一般,一个项目只需要写入到一个报警文件,而不同的任务报警的message不同即可。同时这个文件,一般不需要随着时间变化的,因此,文件名字是需要固定的,同时报警信息尽量简洁。
2013-07-10 11:37:45 698
原创 simpson paradox
其实,以前大家学的只是概率,没有学过统计,而用到的东西又正好相反。或许是自己找借口呢,反正好好补补吧。今天看到simpson paradox ,查了一下资料。著名的是一个文章:Sex bias in graduate admissions Data from Berkeley这里有一个简单的解释:http://fermat1972.blogspot.hk/2008/09/sim
2013-07-09 16:15:03 1428
原创 sub gsub
这两者之间的差别,不用说了,网上一大把。sub替换leftmost,gsub是所有的。测试数据data.txt:ddxddltx abcddexxddtttddabcddtdd ddxx tltddjjddxgddelwd ggdd ltddtddrr cat data.txt | awk -F"\t" '{gsub("dd","*",$3); pr
2013-07-05 15:40:38 1143
原创 脚本处理文本的一周啊
这一周就在整脚本了。我的数据是这样子的 aaaaaameta['ddd', 'ccc', 'des', 'abcd,eee,ff,ddef'] aaaaaafront['dwd', 'xxde', 'ddes', 'ddddss,efsee,ffgg,ddrref']我呢,要做的事情就是把方括号里的单引号内的每一个字段抽出来,然后画张表,发邮件出来。画表、发邮件的脚本
2013-07-05 13:59:53 860
KLINEMathematicalThoughtFromAncientToModernTimes3.pdf
2019-07-21
dtw for time series data
2019-01-16
Handbook of Statistics Vol 21
2018-12-26
pattern recognition, third edtion,PART3
2009-04-08
pattern recognition,third edtion,PART2
2009-04-08
pattern recognition third edition,PART1
2009-04-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人