自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

nciaebupt

自然语言处理 机器学习 信息检索 算法 C++ Python Linux

  • 博客(27)
  • 资源 (11)
  • 收藏
  • 关注

转载 最大熵工具包的使用

最大熵是自然语言处理中经常用到的一种统计方法。网上也有很多最大熵方面的工具包,目前大家用得最多的应该是张乐博士写的最大熵工具包了。该工具包既可以采用命令行形式运行,也可以直接调用接口函数,为大家的研究工作带来了很大的方便。但是,对于刚接触到该工具包的人来说,使用起来还是有些麻烦的。一、命令行形式使用方法       1、利用命令行形式,首先要准备好特征文件。特征文件的格式在最大熵工具包的使

2012-10-28 14:36:48 1297

转载 CRF++使用小结

1. 简述    最近要应用CRF模型,进行序列识别。选用了CRF++工具包,具体来说是在VS2008的C#环境下,使用CRF++的windows版本。本文总结一下了解到的和CRF++工具包相关的信息。    参考资料是CRF++的官方网站:CRF++: Yet Another CRF toolkit,网上的很多关于CRF++的博文就是这篇文章的全部或者部分的翻译,本文也翻译了一些

2012-10-28 14:27:21 1110

转载 libSVM 简易入门

原作:林弘德为什么写这个指南我一直觉得 SVM 是个很有趣的东西,不过一直沒办法去听林智仁老師 的Data mining与SVM的课,后来看了一些Internet上的文件,后来听 kcwu 讲了一下libsvm 的用法后,就想整理一下,算是对于并不需要知道完整 SVM 理论的人提供使用 libsvm 的入门。 原始 libsvm 的README跟FAQ也是很好的文件, 不过你可能要

2012-10-28 14:25:47 1113

转载 memset函数详细说明

1。void *memset(void *s,int c,size_t n)总的作用:将已开辟内存空间 s 的首 n 个字节的值设为值 c。2。例子#includevoid main(){char *s="Golden Global View";clrscr();memset(s,'G',6);printf("%s",s);getchar()

2012-10-26 15:19:26 765

转载 中文分词软件概览

中文分词库IKAnalyzerIKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为...中文分词库Paoding庖丁中文分词库是一个使

2012-10-26 15:00:14 3323

转载 MMSEG :一个基于最大匹配算法的两种变体的中文单词识别系统

发表日期: 1996-04-29 更新日期: 1998-03-06文档更新: 2000-03-12许可: 非商业使用情况下免费Copyright 1996-2006 Chih-Hao Tsai (Email: hao520@yahoo.com)摘要中文文本在计算分析中一个问题是中文文本在印刷时缺少单词的边界,由于单词是一个基本的语义单元,因此有必要识别中文文本的单词以让

2012-10-26 11:10:42 2381

转载 关于MMSEG分词算法

MMSEG是中文分词中一个常见的、基于词典的分词算法(作者主页:http://chtsai.org/index_tw.html),简单、效果相对较好。由于它的简易直观性,实现起来不是很复杂,运行速度也比较快。关于算法的原文,可以参 见:http://technology.chtsai.org/mmseg/总的来说现在的中文分词算法,大概可以笼统的分为两大类:一种基于词典的,一种是非基于词典

2012-10-26 10:58:48 658

原创 人人网笔试题一道

乱序存储10个大小连续的自然数(如6,1,2,3,9,4,5,7,0,8)中随机抽取一个,根据余下的数,如何判定被抽取数的值?如果有1000万或更多自然数时,判定被抽取数的值时,也用同样的方法吗?思路:采用类二分的方法假设原始数列为 a[1000000],取走后数据形成的数列为b[1000000-1]对于数列a来说,la =0,ha=10000000对于数列b来说,lb

2012-10-23 15:42:57 838

转载 2012人人网校园招聘杭州站C++笔试题目

哎,笔试的人真多。今年找工作的人好多啊C++笔试题目。1.算法的几个概念:时间复杂度,空间复杂度等等。2.采用链地址法处理长度的时候,哈希表查找成功的平均长度与哪些因素有关?哈希表的装填因子有关。装填因子= 表中填入的记录数/哈希表的长度。3.二叉树节点的计算:  二叉树中度为1的节点有8个,度为0的节点有3个,问这颗二叉树总共有多少节点?  对于任意一

2012-10-23 14:53:25 1123

转载 人人网2011笔试题(C++方向)回忆

记不大清楚了,如有错误,请海涵,或者留言我好修改。 一 填空选择原题不记得了,考的知识点大概如下:堆排序的空间复杂度,选择排序的最坏情况下的移动次数,拉链法解决散列表冲突,二叉索引树(索引经常修改)应采取的树结构(平衡树?B+树等等),指针和引用,常量指针和指针常量,数组传参,时间复杂度的计算,网络结构层次每层传输的数据叫什么。。。 二 简答题

2012-10-23 14:50:51 875

转载 人人网JAVA笔试题解答

从网上找到一份人人网JAVA的笔试题,做了一下,受益匪浅,贴出来,个人水平有限,欢迎各位留言讨论。                                                                       JAVA 笔试题【填空题】java面向对象的三大特征是:_______,_______,_______.答:封装,继承,多态。

2012-10-23 14:49:49 1484

转载 人人网笔试题(技术类)

人人网笔试题(技术类) 刚刚答完人人网的笔试题,不让把草稿纸带出来,只能凭着记忆复盘了,第一部分还差一题,有人记得可以补充一下,题目基本上都是简单说明,但是意思基本表达到了,第四部分感觉有点困难,天南大还是有很多高手啊,我是结结实实做了2个多小时,提前交的挺多的,呵呵,有些基础题做的不太好,比如那个已知先序和中序求后序就没有弄出来,时间有点不够,再读读离散研究下。原题如下:第一部分(12*

2012-10-23 14:45:34 2815

转载 人人网笔试题目(c++)

人人网来校进行宣讲和笔试,我觉定抱着打酱油的态度 去试一试。              晚上6点钟来到教室的时候,教室里面已经坐了很多人,我随便找个位子坐了下来。第一排坐着几个工作人员,似乎在收简历。我没准备简历,就坐下来看了会书。快6点半的时候,人到得差不多了。那几个工作人员就开始安排,这边android的,这边非技术的,隔壁教室c/java的……。想了想,似乎坐哪都可以。java自

2012-10-23 14:38:58 888

转载 人人网笔试题1

七夕那天,雯雯的男朋友小俞给她买了一颗神奇的魔石。这颗魔石平常是暗淡无光的,但只要给这颗魔石擦上魔粉,魔石就会从内部发出不同颜色的绚丽光泽。非常好看。发出的光的颜色,是在魔石上擦的所有魔粉的编号的异或(Xor)值(如果异或值为0,也是一种颜色,异或值相同表示颜色相同)。雯雯手上现在一共有6种魔粉,编号是6 7 17 46 47 56。雯雯非常想知道这颗魔石究竟能发出多少种颜色的光。由于组合实在太多

2012-10-23 14:37:27 1253

转载 11年千橡互动(人人网)C++笔试题

前面七个选择题凭印象写几个。1.有两个独立的类A和B,下面哪些不能出现在类A中?A. A a       B. B &b    C  A *a     D  B b2. 是一个有关模版函数调用的问题中间几个记不清了。。7. 一个函数的参数是数组,问真正传参的时候,传入的是数组首地址还是整个数组。。这个应该都会的 紧接着就是问答题:

2012-10-23 14:29:02 943

转载 Python按行读文件

1. 最基本的读文件方法:?# File: readline-example-1.py file = open("sample.txt") while 1:    line= file.readline()    if not line:        break    pass

2012-10-22 15:11:31 1041

原创 红黑树相关算法实现(算法导论13章)

/* * copyright@nciaebupt 转载请保留此标记 * 所有代码已经在linux g++ 下编译通过,直接拷贝运行即可 如有问题欢迎指正 * 红黑树(red-black tree)是许多“平衡的”查找树中的一种。 * 红黑树的性质: * 1、每个结点或是红的,或是黑的。 * 2、根结点是黑的。 * 3、每个叶结点(NIL)是黑的。 * 4、如果一个结点是红的,则它的

2012-10-22 14:39:46 1115

转载 在多文件中查找某个字符串

其实这个用的是linux的grep命令:grep "_get_add_kp" * -r"_get_add_kp' 是pattern,如果含有特殊字符则要加上引号。*是目录-r 是option,表示所有的文件,且对子目录递归

2012-10-18 10:20:08 1320

转载 vim 用指定编码保存文件

本文主要讲解下,让Vim能正确显示和保存各种编码文件的一些常用方法。Vim编码配置里面有3个选项,分别是encoding 、fileencodings、fileencoding 简写分别对应为enc、fencs、fenc。encoding(enc): 此项目配置的是vim的默认显示编码,如果你打开的文件编码与该属性配置的编码不同,那么Vim会将编码自动转换到这种编码然后再显示,

2012-10-17 15:37:12 952

转载 python判断list是否为空

判断一个 list 是否为空传统的方式:if len(mylist): # Do something with my listelse: # The list is empty由于一个空 list 本身等同于 False,所以可以直接:if mylist: # Do something with my listelse: # The li

2012-10-16 15:39:37 3808

转载 MySQL 数据库怎样把一个表的数据插入到另一个表

原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://yangfei520.blog.51cto.com/1041581/381568   web开发中,我们经常需要将一个表的数据插入到另外一个表,有时还需要指定导入字段,设置只需要导入目标表中不存在的记录,虽然这些都可以在程序中拆分成简单sql来实现,但是用一个sql的话,会

2012-10-16 11:34:56 919

原创 Linux下如何查看一个文件,如temp.txt 内容的编码方式?

Linux下如何查看一个文件,如temp.txt 内容的编码方式?$ file laji.txt

2012-10-12 16:43:07 1062

转载 vim中添加块注释的方法

vim下1.插入注释:用v进入virtual模式用上下键选中需要注释的行数按Control+v进入列模式按大些“I”进入插入模式,输入注释符“#”,然后立刻按下ESC(两下)2.删除注释先按Control+v进入列模式按光标键选中需要删除的注释符按x键删除本文地址:http://www.yaronspace.cn/blog/index.php/arc

2012-10-11 17:36:33 992

转载 如何掌握Python异常处理问题

想要充分的掌握Python异常处理这门知识,那么就要对Python语言中的结构、语句、变量、函数、预处理指令、输入和输出等内容进行了解掌握,这样才可以轻轻松松的进行Python异常处理问题地解决。下面介绍Python异常处理。导入必要的模块之后,animal.py使用connect()调用建立到服务器的连接。为了处理连接故障,比如,显示故障的原因,该脚本必须捕捉异常。在Python语言中,

2012-10-11 14:55:36 728

转载 Python编程语言操作MySQL数据库实战演习

以下的文章主要介绍的是Python编程语言操作MySQL数据库的实际操作流程,以前发的文章误把mssql错当成mysql。我们大家都知道mssql是微软的SQL Server数据库服务器。下面讨论下Python操纵数据库和Django操纵数据库的一些小知识。python 操作数据库,要安装一个Python和数据库交互的包MySQL-python-1.2.2.win32-py2.5.exe,

2012-10-09 16:48:09 824

转载 python 获取当前时间

我有的时候写程序要用到当前时间,我就想用python去取当前的时间,虽然不是很难,但是老是忘记,用一次丢一次,为了能够更好的记住,我今天特意写下python 当前时间这篇文章,如果你觉的对你有用的话,可以收藏下。取得时间相关的信息的话,要用到python time模块,python time模块里面有很多非常好用的功能,你可以去官方文档了解下,要取的当前时间的话,要取得当前时间

2012-10-09 16:45:41 1043

转载 python文件操作之遍历目录

Python的os模块,包含了普遍的操作系统功能,这里主要学习与路径相关的函数:os.listdir(dirname):列出dirname下的目录和文件os.getcwd():获得当前工作目录os.curdir:返回当前目录('.')os.chdir(dirname):改变工作目录到dirnameos.path.isdir(name):判断name是不是一个目录,name不是目

2012-10-08 17:26:29 735

毕业设计图书管理系统任务书

毕业设计 图书管理系统 任务书 与开题报告同步

2011-10-30

毕业设计图书管理系统开题报告

图书管理系统 开题报告 毕业设计 适合图书管理系统的图书管理系统

2011-10-30

毕业设计图书管理系统

毕业设计 使用C#开发的图书管理系统 环境是vs2008,绝对能用,获得优秀毕业设计

2011-10-30

2008年北邮计算机学院研究生入学考试(复试)上机测试模拟试题

2008年北邮计算机学院研究生入学考试(复试)上机测试模拟试题

2011-02-27

操作系统课件 课件课件

操作系统的课件。大家看看啊,应该有用。课件 教案

2010-05-14

bios调整与密集 设置大全

bios调整与密集讲述笔记本Bois的设置

2010-05-14

用多线程同步方法解决生产者-消费者问题

操作系统 用多线程同步方法解决生产者-消费者问题 课设报告

2009-12-10

操作系统 磁盘调度算法

先来先服务 最短寻道时间优先 扫描 循环扫描

2009-12-10

操作系统 磁盘调度算法

操作系统 磁盘调度算法 先来先服务 最短寻道时间优先 扫描算法 循环扫描算法 课设报告

2009-12-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除