自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Emacser's Blog

Emacs》C++》Lisp》Singular》Scheme》……》

  • 博客(36)
  • 资源 (1)
  • 收藏
  • 关注

原创 例备注 1

这是一个格式化的asdfnote备注的例子。

2008-10-02 20:18:00 441

转载 免费C++库

Linear Algebra MTL, the Matrix Template Library. Dense and sparse matrices and vectors; banded, symmetric, triangular matrices; basic algorithms. C++.            矩阵模版库

2007-12-03 15:37:00 1085

转载 Linux下的段错误产生的原因及调试方法

 1)访问系统数据区,尤其是往  系统保护的内存地址写数据   最常见就是给一个指针以0地址2)内存越界(数组越界,变量类型不一致等) 访问到不属于你的内存区域解决方法我 们在用C/C++语言写程序的时侯,内存管理的绝大部分工作都是需要我们来做的。实际上,内存管理是一个比较繁琐的工作,无论你多高明,经验多丰富,难 免会在此处犯些小错误,而通常这些错误又是那么的浅显而易于消除。但是手工“除虫”(de

2007-03-19 21:38:00 1031

转载 用gdb调试C++程序时打印变量的值

如果这个值是本地变量,那么没有任何的问题。gud-tooltip-mode也能正确显示。不过如果是类里的成员,有的时候就麻烦了。据我目前的观察,有的时候gdb可以正确的找到当前类的继承关系,可以直接使用this来访问相关信息:p *this: 打印出当前类里所有的成员的值p this->member: 打印出当前类里的某个成员的值ptype this: 打印出当前类里所有的成员(原型)wh

2007-03-17 20:05:00 2755

转载 用GDB调试程序

GDB概述————GDB 是GNU开源组织发布的一个强大的UNIX下的程序调试工具。或许,各位比较喜欢那种图形界面方式的,像VC、BCB等IDE的调试,但如果你是在 UNIX平台下做软件,你会发现GDB这个调试工具有比VC、BCB的图形化调试器更强大的功能。所谓“寸有所长,尺有所短”就是这个道理。一般来说,GDB主要帮忙你完成下面四个方面的功能:    1、启动你的程序,可以按照你的自

2007-03-17 20:03:00 619

转载 青年人如何获得成功、自信、快乐

9月初,我在北京给国内的大学生作了几次报告。在我即将踏上飞往美国的班机之前,微软亚洲研究院的沈向洋院长要求我把交流的心得写下来,说这样“会对更多的中国青年人有益”。我跟微软亚洲研究院渊源颇深,事实上,我应该是第一个到研究院访问的美国教授——1998年的那次经历让我印象很深。无论是才华横溢、志向远大的研究员,又或是有着不凡天赋、充满了求知渴望的国内学生,都让我感觉到这所研究院、这座城市(北京)乃

2007-03-08 21:00:00 932

原创 人生的十字路口

记得有首歌是这样开头的:“时间匆匆,潮起潮落……”。人这辈子过的可真快!第一次听到这首歌还是小学的时候,那时候觉得挺流行,于是有空便随便哼哼,只觉得旋律还不错,其它就没什么感觉了。但是现在听到这首歌肯定应该感触颇多了吧。不知不觉,就到了我的第二个本命年了;不知不觉,小学、中学、大学的感觉开始渐渐的离我远去;不知不觉,结婚、相亲、生子这样的字眼在耳边闪现的频率开始多了起来;不知不觉,我第一次

2007-03-06 22:39:00 760

转载 emacs常用模式

C和C++模式=== 指定为C++模式的方法 === 一般根据扩展名自动设定,不用指定,不过有时候若希望.h文件是C++模式的(缺省是C模式),在文件第一行(或其末尾)上加入 // -*- C++ -*-=== 语法高亮 === 不是C模式专有,M-x global-font-lock-mode RET 或在.emacs中加入(global-font-lock-mode t)。

2007-01-10 21:39:00 1211

转载 使用ECB

转自:http://oldoaktree.spaces.live.com/blog/cns!D63B156EC3D184CF!267.entry?_c=BlogPart一、鼠标使用第一左键和中键 ecb-primary-secondary-mouse-buttons 使得下面的组合成立主键:第一键,副键:C-第二键,这是缺省的主键:第一键,副键:C-第一键主键,第一键,副键:第

2007-01-10 21:31:00 1491

转载 数学之美 系列十八 矩阵运算和文本处理中的分类问题

我在大学学习线性代数时,实在想不出它除了告诉我们如何解线性方程外,还能有什么别的用途。关于矩阵的许多概念,比如特征值等等,更是脱离日常生活。后来在数值分析中又学了很多矩阵的近似算法,还是看不到可以应用的地方。当时选这些课,完全是为了混学分的学位。我想,很多同学都多多少少有过类似的经历。直到后来长期做自然语言处理的研究,我才发现数学家们提出那些矩阵的概念和算法,是有实际应用的意义的。在自然语言处

2007-01-05 21:26:00 883

转载 数学之美 系列十七 闪光的不一定是金子 谈谈搜索引擎作弊问题

 Google 研究员 吴军自从有了搜索引擎,就有了针对搜索引擎网页排名的作弊(SPAM)。以至于用户发现在搜索引擎中排名靠前的网页不一定就是高质量的,用句俗话说,闪光的不一定是金子。搜索引擎的作弊,虽然方法很多,目的只有一个,就是采用不正当手段提高自己网页的排名。早期最常见的作弊方法是重复关键词。比如一个卖数码相机的网站,重复地罗列各种数码相机的品牌,如尼康、佳能和柯达等等。为了不让读者看到

2007-01-05 21:23:00 704

转载 数学之美 系列十六 不要把所有的鸡蛋放在一个篮子里 -- 谈谈最大熵模型

[我们在投资时常常讲不要把所有的鸡蛋放在一个篮子里,这样可以降低风险。在信息处理中,这个原理同样适用。在数学上,这个原理称为最大熵原理(the maximum entropy principle)。这是一个非常有意思的题目,但是把它讲清楚要用两个系列的篇幅。]前段时间,Google 中国研究院的刘骏总监谈到在网络搜索排名中,用到的信息有上百种。更普遍地讲,在自然语言处理中,我们常常知道各种各样的但

2007-01-05 21:22:00 1084

转载 数学之美 系列十五 繁与简 自然语言处理的几位精英

 发表者:吴军,Google 研究员 我在数学之美系列中一直强调的一个好方法就是简单。但是,事实上,自然语言处理中也有一些特例,比如有些学者将一个问题研究到极致,执著追求完善甚至可以说完美的程度。他们的工作对同行有很大的参考价值,因此我们在科研中很需要这样的学者。在自然语言处理方面新一代的顶级人物麦克尔 · 柯林斯 (Michael Collins) 就是这样的人。柯林斯:追求完美 柯

2007-01-05 21:20:00 679

转载 数学之美 系列十四 谈谈数学模型的重要性

  发表者:吴军,Google 研究员 [注:一直关注数学之美系列的读者可能已经发现,我们对任何问题总是在找相应的准确的数学模型。为了说明模型的重要性,今年七月份我在 Google 中国内

2007-01-05 21:19:00 850

转载 数学之美 系列十三 信息指纹及其应用

 发表者:吴军,Google 研究员 任何一段信息文字,都可以对应一个不太长的随机数,作为区别它和其它信息的指纹(Fingerprint)。只要算法设计的好,任何两段信息的指纹都很难重复,就如同人类的指纹一样。信息指纹在加密、信息压缩和处理中有着广泛的应用。我们在图论和网络爬虫一文中提到,为了防止重复下载同一个网页,我们需要在哈希表中纪录已经访问过的网址(URL)。但是在哈希表中以字符

2007-01-05 21:17:00 622

转载 数学之美 系列十二 余弦定理和新闻的分类

  发表者:吴军,Google 研究员 余弦定理和新闻的分类似乎是两件八杆子打不着的事,但是它们确有紧密的联系。具体说,新闻的分类很大程度上依靠余弦定理。Google 的新闻是自动分类和整理的。所谓新闻的分类无非是要把相似的新闻放到一类中。计算机其实读不懂新闻,它只能快速计算。这就要求我们设计一个算法来算出任意两篇新闻的相似性。为了做到这一点,我们需要想办法用一组数字来描述一篇

2007-01-05 21:14:00 707

转载 数学之美 系列十一 Google 阿卡 47 的制造者阿米特.辛格博士

 发表者:Google 研究员,吴军 枪迷或者看过尼古拉斯.凯奇(Nicolas Cage)主演的电影“战争之王”(Lord ofWar)的人也许还记得影片开头的一段话:(在所有轻武器中,)最有名的是阿卡 47( AK47)冲锋枪(也就是中国的五六式冲锋枪的原型),因为它从不卡壳、从不损坏、可在任何环境下使用、可靠性好、杀伤力大并且操作简单。我认为,在计算机中一个好的算法,应该向阿卡

2007-01-05 21:13:00 793

转载 数学之美 系列十 有限状态机和地址识别

  发表者:吴军,Google 研究员 地址的识别和分析是本地搜索必不可少的技术,尽管有许多识别和分析地址的方法,最有效的是有限状态机。一个有限状态机是一个特殊的有向图(参见有关图论的系列),它包括一些状态(节点)和连接这些状态的有向弧。下图是一个识别中国地址的有限状态机的简单的例子。每一个有限状态机都有一个启始状态和一个终止状态和若干中间状态。每一条弧上带有从一个状态进入下一

2007-01-05 21:11:00 855

转载 数学之美 系列九 如何确定网页和查询的相关性

 发表者:吴军,Google 研究员 [我们已经谈过了如何自动下载网页、如何建立索引、如何衡量网页的质量(Page Rank)。我们今天谈谈如何确定一个网页和某个查询的相关性。了解了这四个方面,一个有一定编程基础的读者应该可以写一个简单的搜索引擎了,比如为您所在的学校或院系建立一个小的搜索引擎。]我们还是看上回的例子,查找关于“原子能的应用”的网页。我们第一步是在索引中找到包含这三个词

2007-01-05 21:10:00 573

转载 数学之美 系列八 贾里尼克的故事和现代语言处理

发表者:Google 研究员,吴军 读者也许注意到了,我们在前面的系列中多次提到了贾里尼克这个名字。事实上,现代语音识别和自然语言处理确实是和它的名字是紧密联系在一起的。我想在这回的系列里,介绍贾里尼克本人。在这里我不想列举他的贡献,而想讲一讲他作为一个普普通通的人的故事。这些事要么是我亲身经历的,要么是他亲口对我讲的。弗莱德里克.贾里尼克(Fred Jelinek)出生于捷克一个富有的犹

2007-01-05 21:09:00 672

转载 数学之美 系列七 信息论在信息处理中的应用

 发表者:吴军, Google 研究员 我们已经介绍了信息熵,它是信息论的基础,我们这次谈谈信息论在自然语言处理中的应用。先看看信息熵和语言模型的关系。我们在系列一中谈到语言模型时,没有讲如何定量地衡量一个语言模型的好坏,当然,读者会很自然地想到,既然语言模型能减少语音识别和机器翻译的错误,那么就拿一个语音识别系统或者机器翻译软件来试试,好的语言模型必然导致错误率较低。这种想法是对的,而且今天

2007-01-05 21:08:00 545

转载 数学之美 系列六 图论和网络爬虫 (Web Crawlers)

 发表者: 吴军,Google 研究员 [离散数学是当代数学的一个重要分支,也是计算机科学的数学基础。它包括数理逻辑、集合论、图论和近世代数四个分支。数理逻辑基于布尔运算,我们已经介绍过了。这里我们介绍图论和互联网自动下载工具网络爬虫 (Web Crawlers) 之间的关系。顺便提一句,我们用 Google Trends 来搜索一下“离散数学”这个词,可以发现不少有趣的现象。比如,武

2007-01-05 21:07:00 567

转载 数学之美 系列五 简单之美:布尔代数和搜索引擎的索引

 发表者: 吴军,Google 研究员 [建立一个搜索引擎大致需要做这样几件事:自动下载尽可能多的网页;建立快速有效的索引;根据相关性对网页进行公平准确的排序。我们在介绍 Google Page Rank (网页排名) 时已经谈到了一些排序的问题,这里我们谈谈索引问题,以后我们还会谈如何度量网页的相关性,和进行网页自动下载。]世界上不可能有比二进制更简单的计数方法了,也不可能有比布尔运

2007-01-05 21:06:00 565

转载 数学之美 系列四 怎样度量信息

 发表者:吴军,Google 研究员前言: Google 一直以 “整合全球信息,让人人能获取,使人人能受益” 为使命。那么究竟每一条信息应该怎样度量呢?信息是个很抽象的概念。我们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本五十万字的中文书到底有多少信息量。直到 1948 年,香农提出了“信息熵”(shāng) 的概念,才解决了对信息的量化度量问题。一条信息的信息量

2007-01-05 21:04:00 505

转载 数学之美 系列三 隐含马尔可夫模型在语言处理中的应用

发表者:吴军,Google 研究员前言:隐含马尔可夫模型是一个数学模型,到目前为之,它一直被认为是实现快速精确的语音识别系统的最成功的方法。复杂的语音识别问题通过隐含马尔可夫模型能非常简单地被表述、解决,让我不由由衷地感叹数学模型之妙。自然语言是人类交流信息的工具。很多自然语言处理问题都可以等同于通信系统中的解码问题 -- 一个人根据接收到的信息,去猜测发话人要表达的意思。这其实就象通信中,我

2007-01-05 21:02:00 767

转载 数学之美 系列二 谈谈中文分词

 发表者: 吴军, Google 研究员 谈谈中文分词----- 统计语言模型在中文处理中的一个应用上回我们谈到利用统计语言模型进行语言处理,由于模型是建立在词的基础上的,对于中日韩等语言,首先需要进行分词。例如把句子 “中国航天官员应邀到美国与太空总署官员开会。” 分成一串词:中国 / 航天 / 官员 / 应邀 / 到 / 美国 / 与 / 太空 / 总署 / 官员 / 开会。最容易想到的,

2007-01-05 20:59:00 601

转载 数学之美 系列一 统计语言模型

转自:http://hi.baidu.com/csliupu/blog从本周开始,我们将定期刊登 Google 科学家吴军写的《数学之美》系列文章,介绍数学在信息检索和自然语言处理中的主导作用和奇妙应用。发表者: 吴军, Google 研究员 前言也许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它能非常清晰地描述这些领域的实际问题并且给出漂亮的解决办法。每当人们应用数学工具解决一个

2007-01-05 20:07:00 562

转载 谈谈LINUX各个版本的选择

转自:http://blog.kaila.com.cn/user1/fenglei/archives/2006/67950.shtml Linux由于其“自由”和“开放”的特性,衍生出了数百种各具特色的发行版。所谓发行版,就是在Linux内核外包装一些软件,如我们常见的RedHat L

2007-01-04 21:13:00 695

原创 Linux学习十一点建议

 Linux学习十一点建议(转自:http://www.365dn.org/29.html)  随着Linux应用的扩展许多朋友开始接触Linux,根据学习Windwos的经验往往有一些茫然的感觉:不知从何处开始学起。这里介绍学习Linux的一些建议。    一、从基础开始  常常有些朋友在Linux论坛问一些问题,不过,其中大多数的问题都是很基础的。例如:为什么我使用一个命令的时

2007-01-04 18:09:00 669

转载 教育网用户yum使用总结

转自:http://www.linuxsir.org/bbs/showthread.php?t=252326找了好多天资料,终于明白了如何配置,下面把经验与大家分享一下。 首先推荐几个教育网和国内的fc镜像: http://mirror.vmmatrix.net/ CDN Auto Select http://dxmirror.vmmatrix.net/

2007-01-04 13:16:00 1004

转载 用yum管理软件

用yum管理软件转自:http://bbs.linuxsky.net/thread-1641-1-1.html Stuart Ellis Copyright (c) 2005 Stuart Ellis 法律事项 修订记录 --------------------------------------------------------------------------------        

2007-01-04 13:13:00 1314

转载 在Linux fedora 5上安装本地dictd server的方法

1.  使用root登录后,在命令行提示符下用:[root@localhost ~]# yum install dictd安装上dictd,你可以在命令行上使用如下三个命令:a.   [root@localhost ~]# dictd  结果是:      [root@localhost ~]#b.   [root@localhost ~]# dict 结果为:dict 1.9.15/rf on

2007-01-03 23:01:00 622

转载 完全用linux工作

我已经半年没有使用 Windows 的方式工作了。Linux 高效的完成了我所有的工作。GNU/Linux 不是每个人都想用的。如果你只需要处理一般的事务,打游戏,那么你 不需要了解下面这些了。我不是一个狂热的自由软件份子,虽然我很喜欢自由软件。这篇文章也不是用来推 行自由软件运动的,虽然我觉得自由软件运动是非常好的。这篇文章也不是用来比较 Linux 和 Windows 内核效率,文

2007-01-03 16:13:00 991

转载 Emacs的info使用说明

Emacs 的 info 使用说明(转自 http://writeblog.csdn.net/Default.aspx)前已略述 info 的使用法,现在就更进一步详述之。在 EMACS 的线上辅助说明功能中,info 的内容可说是最为丰富的。因为, 任何线上辅助说明的文件都可在 info 模式中找到。因为,info 就是用来

2007-01-02 12:31:00 1432

转载 RSS 简介

(转自 http://www.laoding.com/help/)        RSS说白了就是象收邮件一样的收看网络上的文章。通过这种技术我们可以每天不用打开网站(就像用FOXMAIL不用再打开邮箱所在的网站),只用打开RSS阅读器(就像只用打开FOXMAIL),就可以定时的收到网站新发布的文章。  就像收邮件要装FOXMAIL一样,收文章也必须装专门的软件,比如新浪点点通、看天下、周伯通

2006-12-31 14:44:00 676

转载 emacs配置文件浅谈

emacs配置文件浅谈 (转自cvip.cublog.cn)hvj的讨论和推广emacs贴0:算是抛砖引玉吧,我把自己的emacs经历和配置文件贴上来,并稍作一些讲解,提出一些疑问,和兄弟姐妹们讨论和推广一下这个好东东。这贴先给一些链接吧。http://www.gnus.org/software/emacs GNU emacs的官方网站。http://www.emacswiki.org Emacs

2006-12-31 13:14:00 5088

Test-Driven Development By Example.pdf

测试驱动开发. 测试驱动开发是极限编程的重要组成部分. 大家可以好好学习.

2010-08-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除