- 博客(62)
- 资源 (3)
- 收藏
- 关注
转载 Ubuntu下Java中文乱码解决
cd /usr/lib/jvm/java-1.5.0-sun-1.5.0.15/jre/lib/fontssudo mkdir fallbackcd fallbacksudo cp /usr/share/fonts/truetype/arphic/uming.ttc /usr/lib/jvm/java-1.5.0-sun-1.5.0.15/jre/lib/fonts/fallback
2009-09-01 13:23:00 1219
原创 Build WebKit under Ubuntu9.04
WebKit官方网站 http://webkit.org 过程参考 http://mondaybynoon.com/2007/04/23/installing-and-running-webkit-in-linux-using-qt/ 1.首先下载所需的工具和库 sudo apt-get install libqt4-dev libxslt-dev
2009-07-01 10:15:00 641
原创 利用J2mePolish 2.1 移植J2me程序到Android
关于如何配置j2mePolish程序,请参考上一篇《J2mePolish 打包帮助》 J2mePolish 从2.1.0开始 增加了对Android打包的支持。经过使用,在以下方面存在不足。 1. 资源的处理 j2mepolish能将原j2me内的资源文件映射到android的res/raw中,但是在处理的过程中不支持文件夹,也就是说在copy过程中,会将所有的文件打成
2009-06-26 15:47:00 2424 2
原创 J2mePolish 打包帮助
准备工作下载* Java 2 Standard Edition SDK 1.4 or higher, http://java.sun.com/j2se/ * Sun Java Wireless Toolkit, http://java.sun.com/products/sjwtoolkit/
2009-06-26 15:38:00 1376
转载 使用Vim+Ctags+Cscope阅读源代码
代码阅读工具简介对于学习Linux内核的人来说,源代码的阅读尤为重要。因为所有设计思想、内部机制都是以代码的形式实现,所有的资料也都是为了更好的诠释代码。那么一个好的阅读工具,能够提高阅读的效率和效果。常见的代码阅读工具有,KScope、Source Navigator、SourceInsight、lxr、Cscope等。KScope[1]是一款KDE桌面环境下的源代码
2009-05-31 11:29:00 1412
原创 vim / gedit 打开GBK文件乱码问题
刚从windows转移到ubuntu 9.04中,免不了处理一些GBK编码的文件问题,默认的用vim打开会发现文字的乱码现象。从网上找了找解决办法,主要是编码识别的时候的编码设置问题,具体办法如下。 1.对于vimvim .vimrc将 set fileencodings=ucs-bom,utf-8,cp936,gb18030,big5,euc-jp,euc-kr,latin1 写
2009-05-26 19:13:00 2260
原创 j2me中计算两矩形的相交区域算法
public Region intersection(Region r) { int tx1 = this.x; int ty1 = this.y; int rx1 = r.x; int ry1 = r.y; long tx2 = tx1; tx2 += this.width; long ty
2008-05-16 12:05:00 600
转载 数学之美 系列十九 - 马尔可夫链的扩展 贝叶斯网络 (Bayesian Networks)
2007年1月28日 下午 09:53:00uT("time116999293254246877");发表者:Google 研究员,吴军 我们在前面的系列中多次提到马尔可夫链 (MarkovChain), 它描述了一种状态序列,其每个状态值取决于前面有限个状态。这种模型,对很多实际问题来讲是一种很粗略的简化。在现实生活中,很多事物相互的关系并不能用 一条链来串起来。它们之间的关系可
2007-12-19 17:51:00 956 1
转载 数学之美 系列十八 - 矩阵运算和文本处理中的分类问题
2007年1月1日 下午 03:10:00uT("time116763611149553424");发表者:Google 研究员,吴军 我 在大学学习线性代数时,实在想不出它除了告诉我们如何解线性方程外,还能有什么别的用途。关于矩阵的许多概念,比如特征值等等,更是脱离日常生活。后来在 数值分析中又学了很多矩阵的近似算法,还是看不到可以应用的地方。当时选这些课,完全是为了混学分的
2007-12-19 17:47:00 752
转载 数学之美 系列十七 闪光的不一定是金子 谈谈搜索引擎作弊问题(Search Engine Anti-SPAM)
2006年11月28日 上午 03:18:00uT("time116465599638733502");Google 研究员 吴军自从有了搜索引擎,就有了针对搜索引擎网页排名的作弊(SPAM)。以至于用户发现在搜索引擎中排名靠前的网页不一定就是高质量的,用句俗话说,闪光的不一定是金子。搜索引擎的作弊,虽然方法很多,目的只有一个,就是采用不正当手段提高自己网页的排名。早期最常见的
2007-12-19 17:38:00 495
转载 数学之美 系列十六 (下)- 不要把所有的鸡蛋放在一个篮子里 最大熵模型
2006年11月16日 上午 06:50:00uT("time116362474398958433");发表者:Google 研究员,吴军 我们上次谈到用最大熵模型可以将各种信息综合在一起。我们留下一个问题没有回答,就是如何构造最大熵模型。我们已经所有的最大熵模型都是指数函数的形式,现在只需要确定指数函数的参数就可以了,这个过程称为模型的训练。最原始的最大熵模型的训练方法是一种称为
2007-12-19 17:30:00 471
转载 数学之美 系列十六(上) 不要把所有的鸡蛋放在一个篮子里 -- 谈谈最大熵模型
2006年10月8日 上午 07:27:00uT("time115890519154290698");发表者:Google 研究员,吴军 [我们在投资时常常讲不要把所有的鸡蛋放在一个篮子里,这样可以降低风险。在信息处理中,这个原理同样适用。在数学上,这个原理称为最大熵原理(the maximum entropy principle)。这是一个非常有意思的题目,但是把它讲清楚要用两个
2007-12-19 17:23:00 482
转载 数学之美 系列十五 繁与简 自然语言处理的几位精英
2006年8月23日 下午 11:22:00uT("time115634657041368311");发表者:吴军,Google 研究员 我 在数学之美系列中一直强调的一个好方法就是简单。但是,事实上,自然语言处理中也有一些特例,比如有些学者将一个问题研究到极致,执著追求完善甚至可以说 完美的程度。他们的工作对同行有很大的参考价值,因此我们在科研中很需要这样的学者。在自然语言处理方
2007-12-19 17:22:00 513
转载 数学之美 系列十三 信息指纹及其应用
2006年8月3日 上午 11:17:00uT("time115457675609630123");发表者:吴军,Google 研究员 任何一段信息文字,都可以对应一个不太长的随机数,作为区别它和其它信息的指纹(Fingerprint)。只要算法设计的好,任何两段信息的指纹都很难重复,就如同人类的指纹一样。信息指纹在加密、信息压缩和处理中有着广泛的应用。我们在图论和网络爬虫一 文中
2007-12-19 17:21:00 399
转载 数学之美 十四 谈谈数学模型的重要性
2006年8月9日 上午 09:12:00uT("time115495678350668502");发表者:吴军,Google 研究员 [注:一直关注数学之美系列的读者可能已经发现,我们对任何问题总是在找相应的准确的数学模型。为了说明模型的重要性,今年七月份我在 Google 中国内部讲课时用了整整一堂课来讲这个问题,下面的内容是我讲座的摘要。]在 包括哥白尼、伽利略和牛顿在内的所
2007-12-19 17:21:00 569
转载 数学之美 系列 12 - 余弦定理和新闻的分类
2006年7月20日 上午 10:12:00uT("time115337391327964752");发表者:吴军,Google 研究员 余弦定理和新闻的分类似乎是两件八杆子打不着的事,但是它们确有紧密的联系。具体说,新闻的分类很大程度上依靠余弦定理。Google 的新闻是自动分类和整理的。所谓新闻的分类无非是要把相似的新闻放到一类中。计算机其实读不懂新闻,它只能快速计算。这
2007-12-19 17:20:00 404
转载 数学之美 系列十一 - Google 阿卡 47 的制造者阿米特.辛格博士
2006年7月10日 上午 09:52:00uT("time115244161804028598");发表者:Google 研究员,吴军 枪迷或者看过尼古拉斯.凯奇(Nicolas Cage)主演的电影“战争之王”(Lord ofWar)的人也许还记得影片开头的一段话:(在所有轻武器中,)最有名的是阿卡 47( AK47)冲锋枪(也就是中国的五六式冲锋枪的原型),因为它从不卡壳、从
2007-12-19 17:19:00 760
转载 数学之美 系列八-- 贾里尼克的故事和现代语言处理
2006年6月8日 上午 09:15:00uT("time114968814161581622");发表者:Google 研究员,吴军 读 者也许注意到了,我们在前面的系列中多次提到了贾里尼克这个名字。事实上,现代语音识别和自然语言处理确实是和它的名字是紧密联系在一起的。我想在这回的 系列里,介绍贾里尼克本人。在这里我不想列举他的贡献,而想讲一讲他作为一个普普通通的人的故事。这些事
2007-12-19 17:17:00 464
转载 数学之美 系列九 -- 如何确定网页和查询的相关性
[我们已经谈过了如何自动下载网页、如何建立索引、如何衡量网页的质量(Page Rank)。我们今天谈谈如何确定一个网页和某个查询的相关性。了解了这四个方面,一个有一定编程基础的读者应该可以写一个简单的搜索引擎了,比如为您所在的学校或院系建立一个小的搜索引擎。]我们还是看上回的例子,查找关于“原子能的应用”的网页。我们第一步是在索引中找到包含这三个词的网页(详见关于布尔运算的系列)。现在任何一个搜索
2007-12-19 17:17:00 440
转载 数学之美 系列七 -- 信息论在信息处理中的应用
2006年5月25日 上午 07:56:00uT("time114822338683782989");发表者:吴军, Google 研究员 我们已经介绍了信息熵,它是信息论的基础,我们这次谈谈信息论在自然语言处理中的应用。先看看信息熵和语言模型的关系。我们在系列一中 谈到语言模型时,没有讲如何定量地衡量一个语言模型的好坏,当然,读者会很自然地想到,既然语言模型能减少语音识别和机器翻
2007-12-19 17:16:00 410
转载 数学之美系列六 -- 图论和网络爬虫 (Web Crawlers)
2006年5月15日 上午 07:15:00uT("time114733040963327560");发表者: 吴军,Google 研究员 [离散数学是当代数学的一个重要分支,也是计算机科学的数学基础。它包括数理逻辑、集合论、图论和近世代数四个分支。数理逻辑基于布尔运算,我们已经介绍过了。这里我们介绍图论和互联网自动下载工具网络爬虫 (Web Crawlers) 之间的关系。顺便提
2007-12-19 17:15:00 457
转载 数学之美系列 4 -- 怎样度量信息?
2006年4月26日 上午 08:11:00uT("time114601014752665451");发表者:吴军,Google 研究员前言: Google 一直以 “整合全球信息,让人人能获取,使人人能受益” 为使命。那么究竟每一条信息应该怎样度量呢?信息是个很抽象的概念。我们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本五十万字的中文书到底有多少信息量。直
2007-12-19 17:14:00 409
转载 数学之美系列五 -- 简单之美:布尔代数和搜索引擎的索引
2006年5月10日 上午 09:10:00uT("time114722733511630150");发表者: 吴军,Google 研究员 [建立一个搜索引擎大致需要做这样几件事:自动下载尽可能多的网页;建立快速有效的索引;根据相关性对网页进行公平准确的排序。我们在介绍 Google Page Rank (网页排名) 时已经谈到了一些排序的问题,这里我们谈谈索引问题,以后我们还会谈
2007-12-19 17:14:00 458
转载 数学之美 系列一 -- 统计语言模型
2006年4月3日 上午 08:15:00uT("time114399197227125143");从本周开始,我们将定期刊登 Google 科学家吴军写的《数学之美》系列文章,介绍数学在信息检索和自然语言处理中的主导作用和奇妙应用。发表者: 吴军, Google 研究员 前言也 许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它能非常清晰地描述这些领域的实际问题并且给出
2007-12-19 17:12:00 420
转载 数学之美 系列十五 繁与简 自然语言处理的几位精英(转自google黑板报)
2006年8月23日 下午 11:22:00uT("time115634657041368311");发表者:吴军,Google 研究员 我 在数学之美系列中一直强调的一个好方法就是简单。但是,事实上,自然语言处理中也有一些特例,比如有些学者将一个问题研究到极致,执著追求完善甚至可以说 完美的程度。他们的工作对同行有很大的参考价值,因此我们在科研中很需要这样的学者。在自然语言处理方
2007-12-19 17:09:00 528
转载 数学之美 十四 谈谈数学模型的重要性(google黑板报)
2006年8月9日 上午 09:12:00uT("time115495678350668502"); 发表者:吴军,Google 研究员 [注:一直关注数学之美系列的读者可能已经发现,我们对任何问题总是在找相应的准确的数学模型。为了说明模型的重要性,今年七月份我在 Google 中国内部讲课时用了整整一堂课来讲这个问题,下面的内容是我讲座的摘要。]在 包括哥白尼、伽利略和牛顿在内的所有
2007-12-19 17:03:00 448
原创 JNI应用小例详解
提到JNI,相信很多人都比较熟悉,在这里我只是简要介绍一下使用经验,做个小结。 JNI 全名 Java Native Interface,是Java语言的本地编程接口,是J2SDK中,我们可以在%JAVA_HOME%/include中找到. JNI的主要应用是能够提供Java与其他语言(c/c++)的应用接口转换。比如,在C中你定义了一个方法anymehtod(),而在你现在的
2007-08-03 15:11:00 630
转载 XHtml规则-Html转换为XHtml
XHTML规则XHTML是XML得一个应用,它遵守XML得规范和要求。从技术角度上讲。这些语法规则是由XML规范定义的。XML文档必须遵守的规则使得生成工具以解析文档变得更容易。这些规则也使得XML更容易处理。规则很简单,并且使用过HTML得人对于其中得一些规则应该比较熟悉。我们把XML得规则定义为下列两类: ∷XML语法规则,指的是定义了基本语法要求的规则。∷XML文档规则,指的
2007-07-07 00:40:00 997
原创 Java中将输出缓冲区中数据输出为String
try { InputStream inputStream = new FileInputStream(filepath); BufferedInputStream bis = new BufferedInputStream(inputStream); StringBuffer sb = new StringBuff
2007-07-02 17:00:00 757
原创 Crawl the Nutch -- Map Reduce
初见于Google Lab的Paper, http://labs.google.com/papers/mapreduce.html,论文中表明在有大量集群支撑的情况下,可以快速的在海量文档中进行数据处理。现在你有一堆数据,你需要按记录修改、查询、插入和删除,一种办法是你为这些记录建立索引,比如放入数据库,还有一种办法就是--MapReduce。这种处理方式实际上是在数据存放的时候不建立索引,等实际
2007-06-04 17:14:00 621
转载 MySql常用指令集
一、连接MYSQL。格式: mysql -h主机地址 -u用户名 -p用户密码1、例1:连接到本机上的MYSQL。首先在打开DOS窗口,然后进入目录 mysqlbin,再键入命令mysql -uroot -p,回车后提示你输密码,如果刚安装好MYSQL,超级用户root是没有密码的,故直接回车即可进入到MYSQL中了,MYSQL的提示符是:mysql>2、例2:连接到远程主机上的M
2007-03-30 12:25:00 890
转载 myeclipse中配置spring
关于spring 的电子书笔者下载了好几个,包括 spring in action 中文版 、 spring live 中文版、 spring 开发指南等 。其中spring 开发指南中使用 Eclipse作为开发工具,而笔者刚好在用myEclipse,所以就选择了spring 开发指南作为学习重点。 笔者的开发环境 myeclipse 4.1 +eclipse 3.12 +
2007-03-29 15:48:00 1869 2
转载 Windows下JAVA环境变量的设置祥解
Windows下JAVA用到的环境变量主要有3个,JAVA_HOME、CLASSPATH、PATH。下面逐个分析。JAVA_HOME指向的是JDK的安装路径,如x:/JDK_1.4.2,在这路径下你应该能够找到bin、lib等目录。值得一提的是,JDK的安装路径可以选择任意磁盘目录,不过建议你放的目录层次浅一点,如果你放的目录很深,比如x:/XXXXXX/xxxxx/XXX
2007-03-29 14:16:00 624
原创 关于现有自动问答系统的调查
A:多语种职能检索和问答系统参考链接:http://www.gqb.gov.cn/node2/node3/node42/node44/node58/node85/userobject7ai842.html内容:项目持有者:郑志平 联系方式:E-mail: zheng@CoLi.Uni-SB.DE 项目介绍: 本系统以AnswerBus自动问答系
2007-02-03 16:47:00 1991
转载 句子相似度计算在FAQ中的应用
王洋 秦兵 郑实福(哈尔滨工业大学321信箱,哈尔滨 150001)E-mail: {wy,qinb,zsf}@ir.hit.edu.cn引言 自动问答系统是目前自然语言处理领域一个非常热的问题,它即能够让用户用自然语言句子提问,又能够为用户返回一个简洁、准确的答案,而不是一些相关的网页。因此,自动问答系统和传统的依靠关键字匹配的搜索引擎相比,能够更好地满足用户的检索需求,更准确地找
2007-02-03 16:31:00 5244 1
转载 计算几何常用算法
一、引言计算机的出现使得很多原本十分繁琐的工作得以大幅度简化,但是也有一些在人们直观看来很容易的问题却需要拿出一套并不简单的通用解决方案,比如几何问题。 作为计算机科学的一个分支,计算几何主要研究解决几何问题的算法。在现代工程和数学领域,计算几何在图形学、机器人技术、超大规模集成电路设计和统计等诸 多领域有着十分重要的应用。在本文中,我们将对计算几何常用的基本算法做一个全面的介绍,希望对您了解
2007-01-12 21:05:00 2880
转载 Engine Links
游戏引擎列表Engines _AI Engine BioGraphic Technologies - Advanced AI for Games, Animation and Simulation FEAR — Foundations for Genuine Game AI OpenSteer _Net Engine Rakkarsoft Gamewiz Arkhart — Arkhart
2006-12-05 02:58:00 4229
转载 ASP的内置对象-Server对象
章节:第4章 ASP的内置对象第4节 Server对象 FLASH版演示教案重点:CreateObject方法;MapPath方法难点:虚拟路径内容:Server对象提供对服务器上的方法和属性进行的访问。大部分的方法和属性均是作为实用程序功能服务的。利用Server对象,我们就可以在服务器上启动ActiveX对象,并可以使Active Server服务提供像HTML和URL编码这样的函数,从而
2006-09-21 20:56:00 2464
原创 关于ASP 文件类的使用
asp文件 简单、好用、开发效率高等等是ASP的优点,但是其系统操作方面如文件操作等则 是比较微弱的。要想实现这方面的功能,只有采取调用组件的办法。FileSystemObject对象就是一个例子。ASP安装后,该对象就在系统中注册了。不过其功能也非常一般,只能操作文本类型的文件。不过也可以满足我们的一些需要了。前几天我的一个同事的一个朋友在网上申请了一个支持ASP的空间,想实现诸如用户注
2006-09-21 20:54:00 873
转载 揭开IE自动弹出广告窗之谜
今天打开OL和webuc.net的时候,总会自动弹出一个http://baby.aoe88.com/ad.html的广告窗口,很是奇怪,当时也没有留意,以为是宝玉找的域名商搞的鬼。后来再上别的网站的时候,那个该死的广告又弹出来了,这下我才发觉自己中毒了。于是,马上运行Regedit.exe,切换到:HKEY_LOCAL_MACHINE/SOFTWARE/Microsoft/Windows/
2006-09-10 11:03:00 2616
JavaScript权威指南第五版(JavaScript_The_Definitive_Guide_5th.chm)
2008-12-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人