自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 资源 (8)
  • 收藏
  • 关注

原创 windows下使用批处理文件指定输入输出

因为要给别人做个小工具,需要指定输入输出文件,ubuntu下很容易的啦,但是windows下就有点小麻烦了。尝试用ubuntu下的命令,发现根本不管用的啦,很多命令都是不通用的,我现在觉得啦,如果要做个什么office的文档啥的,用windows还挺方便的,可工作上真不方便了。难怪开发都用ubuntu啊。首先bat文件中,设置classpath时,要用set 来设置。再者,很多地方不是

2011-11-29 17:56:13 2737

原创 utf-8文件读取

写了个client端口的小程序,可在我自己电脑上总是运行成功的,我放在服务器上就不行了。脚本和jar都没问题,后来问编程牛人,说可能是文件读取时是乱码,看了看我确实没有在读取文件时设置读取格式。于是找了找google,发现下面的文档。发现确实是这个问题导致的。记录一下,以后处理中文文档时一定要注意到这个问题,看来经验很重要啊……原来一直是windows的用户,对字体神马的压根就没考虑过。

2011-11-29 16:59:39 847

转载 classpath的设置

java中classpath的设置需要特别注意,尤其是新手,刚开始设置时总是会出现各种问题。刚习惯ubuntu下的环境变量设置,现在要回到windows,试了一上午,都不成功,很是郁闷啊。首先是CLASSPATH的设置,要用set CLASSPATH,再者要用%%还有空格也要注意。还有,不同路径之间用分号;而不是ubuntu下的冒号:。set CLASSPATH=%CLASSPATH%

2011-11-29 13:57:42 1430

原创 ubuntu结束进程

ps -ef 查看都是那些进程在运行kill id,就是终止了id的进程。

2011-11-28 16:22:25 792

原创 java split “.”

转自:http://lguan.iteye.com/blog/169221如字符串:http://www.vvcc.abc.com:8080/ 以“.”分割为字符串数组时,方法如下: String domainNam="http://www.vvcc.abc.com:8080/"; String[] splitStr = domainNam.split("\\.

2011-11-28 15:02:08 678

原创 x200无法连接到无线网络

这两天电脑无线网总是无法连接,在家时是连接总是提示出错,而到了公司开始是连接上了,然后就断掉了。然后就再也连接不上了。上网查找了半天,没找到一个办法能够真正有效的,于是大了thinkpad的400电话。然后技术人员好像以前碰到这个问题过,描述的比我自己还清楚,按照他的指示,成功解决了这个问题。电脑右下角 点击网络图标, 然后点击 打开网络和共享中心, 然后看到 左上角 更改适配器设置,

2011-11-28 14:45:27 5012

原创 学习记录

昨天搞定了DistributedCache,其实我看hadoop的文档时是理解的,可又不理解。感觉这些文档还是没有msdn的说明详细。还好万能的WWW和牛人同事给了帮助。今天上午来办公室后,将代码从新整理了一遍,首先是将很多代码封装到一个method中处理,这样提高了代码的可读性。但是,现在有个问题,这些method需要写testcase吗?忘记问一下了,就提交了code re

2011-11-25 16:07:30 432

原创 分布式下读取文件

advertiserFile = context.getConfiguration().get(ADVERTISER_INPUT);    FileSystem adSystem = FileSystem.get(context.getConfiguration());    FSDataInputStream fsDataInputStream = adSystem.open(new P

2011-11-24 18:11:06 1716

原创 学习安排

今天在公司等着数据跑出来分析呢,可跑的太慢,数据量大,于是看了会thinking in java。看得我想睡觉,感觉没有前几天看的感觉了,可能是因为在办公室吧,看来这种书还是留着来回上班路上看,这样的话,记住一些能记住的,先有个大概印象,等用时再回头来翻看。最近想看的书太多了,头大……集中看几篇文章,看logistic regression,看看CTR模型。另外,打算看

2011-11-23 15:25:45 477

原创 码农笔记

在做test时,需要config中的一些配置文件,此时需要把config在modules中添加为test sources。再者能用foreach的,不要只用for码代码时,要记得在原来的project基础上进行,否则到code review时,就麻烦大了。一段时间只做一件事情,最近在学java,一定要克服掉这个短板。

2011-11-22 15:07:20 642

原创 广告平台

https://adcenter.microsoft.com/  microsoft  adcenter   Show ads on BingGoogle AdSense – Maximize revenue from your online content  Offers a contextual advertising solution to web publisher

2011-11-20 10:15:32 610

原创 zipf distribution

看到计算广告学,看到长尾理论,看到zipf distribution,记载一下。其实,zipf分布和长尾理论是讲同一件事情吧,就是80、20法则的道理。可能20%的网站占据了80的流量。在广告中也是这样吧,可能比这更到尾部吧,只有少量的广告被关注到被点击到,更少量的广告真的起到了成交等后续的行为。http://www.useit.com/alertbox/zipf.ht

2011-11-19 23:35:46 4308

原创 计算广告学

计算广告学包含了很多方的利益,广告主,用户,媒体和广告平台(广告商提供吧,算是广告商的利益吧?)。而且用户的信息改变非常快,广告主的竞价也不稳定,广告主所做的广告活动也是改变很频繁。同时,数据中又会伴随着上亿的关键词、上百万个广告、上亿的用户和上百万的广告主,但是却只有稀少的点击和成交等行为。这个领域是机器学习、经继续、优化理论、分布式系统和信息科学的交叉复杂领域。对如此的复杂问题,传统的机器学习

2011-11-19 21:03:32 2108

转载 java 容器

JAVA的容器---List,Map,Set  Collection├List│├LinkedList│├ArrayList│└Vector│ └Stack└SetMap├Hashtable├HashMap└WeakHashMaphttp://topic.csdn.net/u/20080124/10/eee3f07e-31dd-4b5

2011-11-18 16:36:23 469

原创 code dic

记录一下作为程序员可以找的一些资源,http://www.codebase.com/products/Java/  看了看,很多问题讨论,听同事说有很多例子的。包括各种编程语言的。

2011-11-17 18:20:25 1309

原创 reducer多输出

这几天用同事修改的multipleoutputs做了reducer多输出的工作,备忘一下,由于公司用的hadoop是0.20版本的,所以需要自己重新override multipleTextoutputs函数,这个也是用的同事的代码。但是现在有个问题就是,每一个类型的输出都是那么多reducer,必然会造成有些文件过小。我同事说可以用另外一种方法,好像要在multipleoutput中使用另外一种

2011-11-17 09:26:16 798

翻译 Options

/**     * Add an option that only contains a short-name.     * It may be specified as requiring an argument.     *     * @param opt Short single-character name of the option.     * @param ha

2011-11-16 19:26:33 665

原创 shell scripts

--help一般是全称的写法,-h一般是缩写的写法;在ubuntu下面没有root用户,这个时候要想进行root操作,需要在命令前添加sudo 即转到root权限下,记得在操作完成后及时exit。/usr/lib/jvm/java-6-sun-1.6.0.26

2011-11-16 15:10:29 477

转载 vim 使用

sudo vim filename如果出现权限问题,sudo解决。wiki上说了,Sudo(substitute user [或 superuser] do),是一种程序,用于类Unix操作系统如BSD,Mac OS X,以及GNU/Linux以允许用户通过安全的方式使用特殊的权限运行程序(通常为系统的超级用户)。我发现这几天对我来说简直就是地狱,什么都回到零点地带

2011-11-16 12:16:11 490

转载 ubuntu计算器

qalculate sudo apt-get install gcalctool

2011-11-07 17:31:45 6092

转载 sh for

for ((i=1;i<=5;i++));do ping 192.168.1.$i;done for ((i=1;ifrom http://hi.baidu.com/baijunhui/blog/item/fb358339fdf1cdfb3b87ce85.html原来脚本如此的naive,整的我都不敢用了。

2011-11-01 20:13:44 788

原创 牛人地址

推荐系统的牛人,其中其09年的iui的文章是best,Tagsplanations Explaining Recommendations using TagsJohn Riedl    url  http://www-users.cs.umn.edu/~riedl/计算广告学的yahoo牛人,Andrei_Broderhttp://research.yahoo.com/Andr

2011-11-01 14:40:53 946 2

原创 良好的design

工作之后第一个正式的design,被老大否了。其实自我的负面否定情绪并不多,从新做design,从中学到了很多,也大概对各个部分的东西都了解的差不多了。现在几个有待确定的问题就是等老大敲定了。先总结一下吧。1. 工作中无论是谁拍板的事情,你来准备的东西,就要准备的全面想的周全,这是对自己的一种交代,也是对领导的一种交代。2. 不要总是认为自己是新人就觉得别人应该给自己把

2011-11-01 09:47:51 415

KLINEMathematicalThoughtFromAncientToModernTimes3.pdf

Mathematical Thought from Ancient to Modern Times vol3

2019-07-21

my sql cookbook

my sql cookbook 2ed edition in chinese. please use it for study.

2019-01-16

dtw for time series data

dtw paper for time series data in big data. if you think it is useful please index it.

2019-01-16

Handbook of Statistics Vol 21

Handbook of Statistics Vol 21 - Stochastic Processes - Modeling and Simulation (Elsevier, 2003)

2018-12-26

pattern recognition, third edtion,PART3

Theodoridis S., Koutroumbas K. Pattern Recognition.3rd.ed.(AP, 2006)(840s) english edition

2009-04-08

pattern recognition,third edtion,PART2

Theodoridis S., Koutroumbas K. Pattern Recognition.3rd.ed.(AP, 2006)(840s) english edtion

2009-04-08

pattern recognition third edition,PART1

Theodoridis S., Koutroumbas K. Pattern Recognition.3rd.ed.(AP, 2006)(840s)

2009-04-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除