- 博客(18)
- 收藏
- 关注
原创 CareerCup 1.3
Problem: Design an algorithm and write code to remove the duplicate characters in a string without using any additional buffer NOTE: One or two additional variables are fine. An extra copy of the a
2012-04-18 11:24:39 938
原创 Career-Cup-150 1.2
Problem: Write code to reverse a C-Style String (C-String means that “abcd” is represented as five characters, including the null character )Solution: 代码在下面分析(1) 确定两个指针分别指向字符串的头和尾部,交换这两个指针所指向
2012-04-17 16:20:04 2507
原创 CareerCup-150 1.1
Career Cup 刷题活动开始..............第一题:Implement an algorithm to determine if a string has all unique characters What if you can not use additional data structures?思想:基本思想还是使用哈希,对数组中的每个元素对应到哈希表中并
2012-04-16 14:52:21 2742 2
原创 宾州中文树库标记以及其解释, Penn Chinese Treebank Tag Set
The Chinese Penn Treebank Tag Set1 Part-Of-Speech tags: 33 tags 标记英语解释中文解释ADadverbs副词ASAspect marker 体态词,体标记(例如:了,在,着,过)
2012-03-20 19:00:48 26747 4
原创 lambda 演算 学习
前言因为最近在学习组合范畴文法,也就是CCG(combinatory categorial grammar)。这种文法在表达语义的过程中使用到一些关于lambda演算的一些知识,所以在网上找到一些资料错略的学习了一下。在这里把所学习的内容整理一下以便以后学习参考。lamb
2011-10-07 15:17:49 10702 1
转载 自然语言处理相关词汇
本文转自:http://www.ebigear.com/news-26-20865.html abbreviation 缩写 [省略语]ablative 夺格(的)abrupt 突发音accent 口音/{Phonetics}重音accusat
2011-09-30 15:52:28 6381
转载 位向量和排序
对于排序问题,想必大家都非常熟悉。而且,应该都知道基于比较的排序方法的时间复杂度的下界是 O(n*logn)。尽管又出现了基数排序,使得排序类算法的时间复杂度改进到 O(d*n),但是基数排序方法实现起来还是比较麻烦的。下面这种排序方法的时间复杂度可以认为是 O(n),但是和基数排序方法相比,它的实现非常简单。 为了介绍这种方法,需要对输入数据作如下假定:(1)都是非负整数,(2)每个整数最多出现一次,(3)最大整数小于 n。 这种方法采用哈希函数的思想,用一个整型数组 array
2010-07-03 16:50:00 976
原创 perl 中文处理 乱码
今天在处理数据时,发现perl的中文输出总是乱码,后来用use Encoding;encode("gbk", decode("utf-8", $str));这样的语句转一下就好了,decode的应该是$str原来的编码方式,转为后面的编码方式就可以了。
2010-04-07 18:30:00 3732
转载 perl 正则表达式
一.模式匹配操作符1.tr/ / / 替换操作符不支持正则表达式 也不具备双引号替换能力 m/ / s/ / / 都支持正则表达式,并且可以提供或限制双引号替换能力(当用单引号作为操作符时则不具备变量替换能力)s/ / / , tr/ / / 可以用两组不同的括号进行分割,以保证格式清晰s(good)2.绑定操作符 =~ , !~,m/ / s/ / / tr/
2010-04-04 17:03:00 1819
转载 生成模型与判别模型
自然语言处理中,经常要处理序列标注问题(分词、词性标注、组快分析等),为给定的观察序列标注标记序列。 令o和s分别代表观察序列和标记序列, 根据贝叶斯公式, 1 生成模型和判别模型的定义 对o和s进行统计建模,通常有两种方式: (1)生成模型 (产生模型) 构建o和s的联合分布p(s,o) (2)判别模型 (条件概率模型, 条件模型) 构建o
2010-04-04 17:03:00 4619
转载 自然语言处理的一些资源 NLP 资源
Software Tools for NLPSoftware ArchiveCMU Artificial Intelligence Repository Resources Available Through CRL SIL Computing Resources Linguistics Tools at the University of Vaasa in Finla
2010-03-26 09:47:00 4218
原创 trie 树 和 双数组实现trie树
一些资料 http://linux.thai.net/~thep/datrie/datrie.html#Ref_Aho+1985 http://my.huhoo.net/archives/2009/04/double_array_trie.html#DAT.E5.AE.9A.E4.B9.89 http://blog.csdn.net/krens/archive/2008/0
2010-03-11 10:25:00 1064
原创 使用 getopt() 进行命令行处理 ( 转 )
转自: http://lhg803.javaeye.com/blog/409216 所有 UNIX® 程序甚至那些具有图形用户界面(graphical user interface,GUI)的程序,都能接受和处理命令行选项。对于某些程序,这是与其他程序或用户进行交互的主要手段。具有可靠的复杂命令行参数处理机制,会使得您的应用程序更好、更有用。不过很多开发人员都将其宝贵的时间花在了编写自
2010-02-01 15:16:00 683
原创 berkeley parser 出错信息
今天在帮费晓旭调试berkeley parser,出现下面问题:Exception in thread "main" java.lang.NoClassDefFoundError: edu.berkeley.nlp.PCFGLA.BerkeleyParserat java.lang.Class.initializeClass(libgcj.so.7rh)Caused by: java.lang
2010-01-28 19:34:00 2251 2
原创 转载
恭喜,你选择开发工程师作为自已的职业! 悲哀,你选择开发工程师作为自已的职业! 本文所指的开发工程师,仅指程序开发人员和以数字电路开发为主的电子工程师。当你选择计算机或者电子、自控等专业进入大学时,你本来还是有机会从事其它行业的,可你毕业时执迷不悟,仍然选择了开发作为你的职业,真是自作孽不可活。不过,欢迎你和我一样加入这个被其它人认为是风光无限的“白领”吧。如果你不是特别地与人世隔绝,我想
2009-12-23 22:17:00 708
原创 关于 IIS 和 windows xp 的 防火墙 问题
前一阵子在写实验室的资源共享平台,已经开始使用几天了。几天想上去看看,却怎样也上不去了,但是本机却是能上去的,感觉原因可能和防火墙有关,然后我就试着把服务器的防火墙关了,发现确实好用了。检查了一下防火墙的设置如:控制面版-安全中心-windows防火墙-高级-本地连接(设置)中将 WEB 服务器(http)前打勾 点击确定这个我已经设置了,但是还是不好用,后来发现:在
2009-12-22 21:35:00 790
原创 秀language model
其实,从九月份进入实验室基本上就一直在写程序,基本理论基本上都没怎么看,我的language model 基本上用了1到2个月的时间写完的吧,然后就开始给实验室做个管理实验室内部资料用的网站,都是一些基本功能,不过由于当时没怎学网站制作而且用的是最新的Asp.net来实现的,所以还是花了不少功夫,一些简单问题也要查一下。 今天师兄突然让我在下下周把我的language model 讲一讲,
2009-12-18 10:07:00 921
原创 搬家了,搬到CSDN来...
感觉还是csdn上的牛人比较多,为了方便学习还是搬到csdn来把,呵呵,也想好好写写一些文章....,这个就算是开始了吧...
2009-12-18 09:50:00 671
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人