其他
文章平均质量分 55
csdidi
这个作者很懒,什么都没留下…
展开
-
Source Insight 经典教程
<br />Source Insight实质上是一个支持多种开发语言(java,c ,c 等等)的编辑器,只不过由于其查找、定位、彩色显示等功能的强大,常被我们当成源代码阅读工具使用。<br />作为一个开放源代码的操作系统,Linux附带的源代码库使得广大爱好者有了一个广泛学习、深入钻研的机会,特别是Linux内核的组织极为复杂,同时,又不能像windows平台的程序一样,可以使用集成开发环境通过察看变量和函数,甚至设置断点、单步运行、调试等手段来弄清楚整个程序的组织结构,使得Linux内核源转载 2010-07-08 19:02:00 · 596 阅读 · 0 评论 -
改写Hadoop的wordcount程序
实验内容与要求1. 在Eclipse环境下编写WordCount程序,统计所有除Stop-Word(如a, an, of, in, on, the, this, that,…)外出现次数k次以上的单词计数,最后的结果按照词频从高到低排序输出;2. 在集群上运行程序,对莎士比亚文集文档数据进行处理;3. 可自行建立一个Stop-Word列表文件,其中包含部分停词即可,不需要列出全部停词;参数k作为输入参数动态指定(如k=10)代码: import java.io.*;import原创 2011-04-20 21:07:00 · 2669 阅读 · 0 评论 -
单机Hadoop系统测试命令
<br /> <br />安装好单机Hadoop系统后,我们使用其自带的wordcount程序进行简单的测试,以下是一些简单的命令:<br /> <br />格式化hdfs文件系统:<br />做以这一步之前最好先删除tmp文件夹中的内容,不然上次存留的datanode数据会与这次产生冲突,造成Incompatible DatanodeID。<br />hadoop namenode -format<br /> <br />开启dfs和mapreduce:<br />start-all.sh<br /> <原创 2011-04-10 20:28:00 · 1058 阅读 · 0 评论 -
使用ICTCLA api进行中文分词实验的过程备忘
<br />机器翻译最后一个大作业需要使用moses搭建一个机器翻译系统。其中有一步中要调用ICTCLA api实现中文分词,晚上稍稍熟悉了一下ICTCLA,大概了解了它的原理和使用方法,在此将使用它的方法和实验过程加以简述,以备忘。<br /> <br />我是在ubuntu 9.10系统中进行实验的,故而需要下载linux版本的ICTCLA。我首先下的是java版本,但是在ubuntu中使用时出现了问题,后换成了C++版本。在解决了实验过程中在C++版本里出现的问题之后,回头看java版本,之前遇到的是原创 2011-02-21 21:23:00 · 2941 阅读 · 0 评论 -
使用Moses搭建一个机器翻译系统及实验记录
<br />一. 搭建实验环境:<br />ubuntu系统可以直接下载安装deb包即可,需要安装的deb包有Srilm, GIZA++, mkcls以及从 http://www.statmt.org/wmt08/scripts.tgz上获得的一些脚本文件。如果不是ubuntu系统的话,需要下载这些工具的源代码进行编译安装。<br /> <br />下面简述使用源代码编译的方法搭建环境中的步骤,直接使用deb安装的可以跳过:<br />1. 安装Srilm:<br />下载Srilm源码文件,解压。ht原创 2011-02-22 17:14:00 · 7355 阅读 · 2 评论 -
Daikon在windows上的安装
由于项目需要,这两天在windows上安装程序不变式分析工具Daikon(很强大的工具哦~~)Daikon主要的适用平台是Linux,虽然网站上介绍说是可以装在windows下,但按照它介绍的方法去做总是不成功。因为它所默认使用的C/C++前端编译工具使用的是Kvasir,而Kvasir是与Linux平台相关的,在Cygwin中装不起来。上学期用各种办法试了几次,不行,昨天折腾一晚上装Kvasir,还是不行。于是今天决定放弃使用Kvasir作为前端编译工具。Daikon网站上介绍说还有一种叫Mangel-w原创 2010-09-03 17:15:00 · 1966 阅读 · 2 评论 -
ZOJ题目分类 POJ题目分类
<br /> ZOJ题目分类<br />初学者题:<br /><br />1001 1037 1048 1049 1051 1067 1115 1151 12011205 1216 1240 1241 1242 1251 1292 1331 1334 1337 1338 1350 1365 13821383 1394 1402 1405 1414 1494 1514 1622 1715 1730 1755 1760 1763 17961813 1879 1889 1904 1915 19转载 2010-07-18 00:43:00 · 900 阅读 · 0 评论 -
POJ题目分类小结
<br />初期:<br />一.基本算法: <br /> (1)枚举. (poj1753,poj2965)<br /> (2)贪心(poj1328,poj2109,poj2586)<br /> (3)递归和分治法. <br /> (4)递推. <br /> (5)构造法.(poj3295)<br /> (6)模拟法.(poj1068,poj2632,poj1573,poj2993,poj2996)<br />二.图算法: <转载 2010-07-09 21:06:00 · 373 阅读 · 0 评论 -
完整版本的 poj 题目分类
<br />DP:<br /> 1011 NTA 简单题<br /> 1013 Great Equipment 简单题<br /> 1024 Calendar Game 简单题<br /> 1027 Human Gene Functions 简单题<br /> 1037 Gridland 简单题<br /> 1052 Algernon s Noxious Emissions 简单题<转载 2010-07-09 21:22:00 · 1097 阅读 · 0 评论 -
SlickEdit 2011破解方法
转自http://zhiwei.li/text/2011/05/slickedit-2011/中午在ubuntu 11.10下安装slickedit 16.0.0.6,网上找到一篇破解方法。遂markWindows 32位版本 修改方法如下0x40E77A 处 mov al, bl 改为 mov al, 1也就是 文件slickedit/w转载 2012-03-26 23:09:10 · 2843 阅读 · 0 评论