自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(86)
  • 资源 (4)
  • 收藏
  • 关注

原创 Ant执行JUnit测试并生成报告

下面这个xml文件是我修改后能够成功运行JUnit测试并且生成测试报告的ant执行文件。先列出代码作为参考,再介绍一些我写该文件过程中遇到的问题并做一些分析,希望对后来学习者有所帮助。

2012-12-11 15:11:24 3372 4

原创 用Rules来控制JUnit的执行

本文主要依据以下几篇介绍及个人理解所整理,转载请注明,发现错误请指出,谢谢。JUnit Rules: http://wiki.alfresco.com/wiki/JUnit_RulesUsing Rules to Influence JUnit Test Execution:http://cwd.dhemery.com/2010/12/junit-rules/JUnit

2012-12-06 17:48:56 3440 1

原创 多重背包问题解法简单分析(POJ 1276为例)

先简单介绍几种背包问题:01背包(ZeroOnePack): 有N件物品和一个容量为V的背包, 每种物品均只有一件。第i件物品的费用是c[i],价值是w[i]。求解将哪些物品装入背包可使价值总和最大。  完全背包(CompletePack): 有N种物品和一个容量为V的背包,每种物品都有无限件可用。第i种物品的费用是c[i],价值是w[i]。求解将哪些物品装入背包可使这些物品的费用总和不超过背包容

2012-12-05 19:36:30 1040

原创 Selenium 1.0使用问题集锦

Selenium 1.0使用问题集锦1.    APISelenium 1.0主要API参考:http://release.seleniumhq.org/selenium-core/1.0.1/reference.html2.    多窗口问题在selenium模拟测试中,多窗口也是一个很关键的问题。例如,我们可能需要打开一个新窗口并在里面执行一些操作。或者我们点击了一个链接后弹出

2012-12-05 19:36:28 1136

原创 利用Firebug和XPath寻找locator

当我们利用Selenium对web UI进行测试的时候,locator是即为重要的元素,如何准确有效地确定页面中需要测试的元素的locator对web应用程序测试极其重要。但因为selenium支持多种形式的locator,如xpath、CSS、DOM、name、id、link等,所以找locator也就多种多样。比如如果我们知道网页源码结构的话,就可以直接写出相应的locator。但是毕竟现在的

2012-12-05 19:36:26 1824

原创 JUnit中标注Annotation介绍

java标注(Annotation)对于Annotation,是Java5的新特性,JDK5引入了Metedata(元数据)很容易的就能够调用Annotations。Annotations提供一些本来不属于程序的数据,比如:一段代码的作者或者告诉编译器禁止一些特殊的错误。An annotation 对代码的执行没有什么影响。Annotations使用@annotation的形式应用于代码:类(

2012-12-05 19:36:24 976

原创 一些简单的Linux命令

这些命令仅是在工作中的linux机器上运行正常的,在其他系统中正常与否有待验证。ubuntu: sudo apt-get installGNU/linux: sudo yum installuname [-amnrsv][--help][--version]显示系统信息 http://zhidao.baidu.com/question/39995251

2012-12-05 19:36:22 752

原创 oracle数据库的使用及安装

Oracle端口:1521端口:oracle数据库默认端口1158端口:oracle emctl默认端口8080端口:oracle XDB (XML)210端口:oracle XDB FTP服务Windows平台下命令行oracle的使用操作:1. 启动与停止oracle服务器set oracle_sid=orclemctl stop dbconsoleemctl start dbconsole启

2012-12-05 19:36:19 765

原创 Ubuntu 12.04安装openGL与opencv

安装过程中遇到的问题:1。 无法解析或打开软件包的列表或是状态文件E: Encountered a section with no Package: header办法:sudo rm /var/lib/apt/lists/* -vfsudo apt-get updatehttp://blog.163.com/iris0324@126/blog/static/13176964020114251157

2012-12-05 19:36:17 1133

原创 后缀数组

后缀数组是用来替代后缀树的一种比较巧妙的数据结构,它比后缀树容易编程实现,能够实现后缀树的很多功能而时间复杂度也不太逊色,并且,它比后缀树所占用的空间小很多。详细参考百度百科的介绍:http://baike.baidu.com/view/1240197.htm在概念方面,百科里面介绍的比较清楚,这里就不再重复了。但是里面在具体思路及编程实现方面介绍的有点混乱(个人觉得),因而这里根据自己的理解再做

2012-12-05 19:36:15 512

原创 情感对象抽取【opinion mining】

情感对象抽取By twenzon 2012-4-20观点挖掘与情感分析在近十年得到快速发展,研究也因为应用的需求从最初的情感分类[1,2]发展到现在的各种研究方向如情感对象抽取、情感极性判断、情感持有者抽取、情感主体抽取等[3]。因为产品评论中存在着重要的商业情报(如产品的哪些特征具有什么优缺点,消费者是否喜欢,和其他竞争品比较怎么样),对其进行观点挖掘很有意义。这显然不仅需要抽取观点极性,还需要

2012-12-05 19:36:13 1374

原创 系列前m大数算法总结

有的时候想想懒得每次遇到类似问题就重新编代码,所以主要是为了保存代码,就重新记录一些简单题的解法。问题:给定一个无序系列包含有n个数,求其前m大数算法:1. 对该系列进行排序,然后取前m大的数。算法时间复杂度为O(nlogn)2. 如果m比较小,对系列流有序保存前m大数,时间复杂度为O(mn)3. 维持一个m个元素的最小堆,该堆保存的是前m大数,新添加的数只要跟该堆中最小数比较,若大则替换并调整堆

2012-12-05 19:36:11 1038

原创 中位数(第k大数)快速求法

本文为twenz根据个人经验整理,转载请注明来源,谢谢! 中位数即为一系列数中的大小在中间位置的数,快速找中位数的有效方法有:1.排序法:先对数组进行排序,时间复杂度为O(nlogn),然后选择中间的数2.快排的筛选法(类似于找第k大的数):思想是选定一个数,找比它大的数和小的数,然后根据数量再在大的部分或者小的部分循环递归找,时间复杂度应该为O(n) 如果给定两个有序的系列,需要查找他们共同的中

2012-12-05 19:36:09 3752

原创 Word问题集锦

文档写作是发表论文、提交写作报告的一个重要方式和途径。Microsoft Office Word则是一个很重要的文档编辑工具。本文主要记录个人遇到的word问题及解决方案。遗憾以前记录的一些材料竟然丢失了,很是可惜。本文将持续更新~1. Word无法修订、修订无法接受“接受所选修订”按钮却是灰色的不能使用,在修订内容上右击出现的菜单中的命令选项也是灰色的不能用。怀疑是不是哪里设置了限制,找了半天才

2012-12-05 19:36:07 5199

原创 带负号大数加减法简单程序

应一位网友要求写的个程序,如有朋友发现有错欢迎指出: #include #include using namespace  std;#define LEN 30void sub(char str11[],char str22[],char str33[]);void removeZero(char str[]);bool smallThan(char str1[],char str2[]){  

2012-12-05 19:36:05 638

原创 文件流fstream处理多个文件

问题:1. 我们在调用文件流fstream解决实际问题时,常常会遇到要读入多个文件或创建输出多个文件。但是我们又不想定义很多的流,而只想用一个输入流ifstream和一个输出流ofstream就搞定。该怎么办呢?2. 很简单的嘛,直接先定义流,每次涉及到一个文件读入读入时候直接调用open()函数,完毕后就close()。可是实际结果好像不如人意,比如读入的文件好像只有第一个文件被读入了,而其他都

2012-12-05 19:35:58 3851

原创 Java中Object的使用:重载equals、hashCode及实现compareTo

这里主要介绍Java中使用Hashtable、Arrays.sort时候如果键值涉及到对象、类时候的处理办法:1. 重载equals():java中默认的对象的equals是当指向同一内存地址时才为true;如果你现在需要利用对象里面的值来判断是否相等,则重载equal方法。2.重载hashCode():只有当类需要放在HashTable、HashMap、HashSet等等hash结构的集合时才会

2012-12-05 19:35:56 2502

原创 HIT LTP的使用及利用句法关系简单抽取示例

中文的分词工具相对来说多点,比较有名的是计算所的ICTCLAS,哈工大的LTP,斯坦福的Parser等。但是命名实体识别、句法分析等的工具却不多,我所知的有哈工大的LTP、Stanford Parser。由于Stanford Parser最先是针对英文的处理工具,在中文上效果相对来说比LTP差些。下面我介绍一些个人对LTP的简单认识及初步使用。不同于Stanford Parser的java版本,L

2012-12-05 19:35:54 8478

原创 C++及Java连接MySQL方法

Java连接MySQL1.下载一个connector的jar包,例如 mysql-connector-java-5.1.7-bin.jar;2.工程-》属性-》库中:添加外部jar,选择下载的connector的jar包即可;3.简要连接程序参考:import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQL

2012-12-05 19:35:51 722

原创 利用Stanford Parser进行中文行为抽取

注:转载请注明出处twenz。欢迎大家交流探讨,指出错误,有什么好的建议方法也请给我留言。利用Stanford Parser进行中文行为抽取(Action mining)问题所谓的行为抽取就是从开源文本中获取关于给定的某个人/组织的行为,主要包括主语、谓语和宾语。其中主语是给定的一些词表示了需要抽取的信息对象(人、组织或团体)。谓语和宾语则表示了行为。例如,我们要抽取关于“塔利班”的行为,则给定句

2012-12-05 19:35:49 4656 4

原创 poj 3865 数据库冗余问题判断

问题:给定由1-n索引的两列数据,问是否存在两行的某两列列值完全相同,即k1.c1 = k2.c1且k1.c2 = k2.c2办法1:对第一列排序(o(nlogn)),找到第一列中列值相同的(mi个)在第二列中根据相应索引取出所有值并排序(o(milogmi)),顺序找出值相同的(mi)。总时间复杂度为o(nlogn+∑(mi+milogmi+mi))=o(nlogn+2n+∑milogmi)=o

2012-12-05 19:35:47 1261

原创 poj 3847 树(链接表与堆栈的实现)

Moving to Nuremberghttp://poj.org/problem?id=3847树中给定各边长及每点要到达的次数。求最优的点,满足所走路径和最小,要求:使得从该点开始访问其他点的次数符合给定要求并且每次只能访问一个点并返回。思路:任何一条边可以把树分成两颗子树,假定我们知道了一颗子树需要访问的次数和accessnum,则另一颗访问和是剩下的部分。于是该边上两点啊a,b若选为目标点

2012-12-05 19:35:45 545

原创 poj解题报告整理

2011-04-29整理 poj 下载源码:http://download.csdn.net/source/2854844poj 1080 动态规划poj 1141 动态规划poj 1961 KMP串匹配poj 2406 KMP串匹配poj 3614 贪心解决最大匹配poj 3659 树形dppoj 3674 之枚举+贪心与搜索POJ 3821 ClickomaniaPOJ 3842 排列问题po

2012-12-05 19:35:43 1336

原创 poj 3899 The Lucky Numbers

http://poj.org/problem?id=3899思路:1. 可以总结出n位数的lucky numbers有2^n个2. 求[A,B]间的lucky numbers个数,如果A和B位数相同,则求f(A,B),否则造出一个数C=99…9,位数和A相同,一个数D=11…1,位数和B相同,求f(A,C)+f(B,D)+2^i(i为大于A的位数小于B的位数的所有整数)现在就转化为求子问题f(A,

2012-12-05 19:35:41 773

原创 C#爬取动态网页

一直在尝试用java来爬取网页,然而java总是无法处理动态网页,尤其是js产生的网页。而在如今的web2.0时代,许多的数据都涉及到js,比如新闻评论、微博等。java中htmlparser和htmlunit结合是可以处理静态网页、提交表单的,如爬取人人网,但对于新闻评论就没办法了。也有一些号称可以处理动态网页的开源项目,如jrex等一些开源的浏览器项目。但是我试过之后,总是不能很好的解决,有的

2012-12-05 19:35:39 8107 3

原创 POJ 3842 排列问题

给定几个数,求其排列排列问题可以转化为递归搜索~低位安排不同的数,求剩下的数的排列,再递归效果还不错,时间效率暂时第一啊,还是我在poj的首次哦http://poj.org/problemstatus?problem_id=3842#include using namespace std;int prime[5000],pn,num[10],res,tab[10],sl;bool p[10000]

2012-12-05 19:35:37 585

原创 POJ 3821 Clickomania

http://poj.org/problem?id=3821遍历搜索:用数组保存中间结果(类似动态规划思想)几种情况:串AxAyAz1. Ax:最开始的相同字母串A可以消掉,判断x,可消返回真,否则继续;2. AxAz:首字母串肯定要与后面的字母串合起来一起消,问题变为判断AxA和yAz(可能不含A)两个子串;3. AxA: 输入串或2都可能产生串AxA的形式,只要判断x,或者将AxA转化成AyA

2012-12-05 19:35:35 659

原创 情感词生成 [opinion mining]

我们知道,在情感挖掘中,主要有情感分类(Sentiment Classification)和情感抽取(Opinion Extraction)。对于文档情感分类,一般是构造特征向量来进行分类或是聚类。也有通过计算文档中词的情感分数来获取文档的情感极性,然而这种方法用的不多,效果也不佳。但是对于句子级别的情感挖掘,由于特征少,情感分类效果没有那么理想,而句子的情感往往是由句子中的几个情感词决定。因而获

2012-12-05 19:35:33 2621

原创 Eclipse中ICTCLAS 2011 的java调用

本文由twenz整理。以前ICTCLAS官方网站上并没有官方的java版本,只有一些爱好者根据c++改写的几个java版本供下载。2011/2009则提供了官方的java调用版本,但分词程序的实现应该还是基于c++的dll文件,只是提供了java的借口。下面简要介绍eclipse中使用ICTCLAS2011的简要步骤: 1. 下载最新版的分词开源软件ICTCLAS的java版(Windows)IC

2012-12-05 19:35:25 1260

原创 Eclipse中Pydev的安装

1.下载Python interpreter并安装2. 将Python安装目录配置在环境变量中3.Eclipse->帮助(help)->软件更新(software update)->查找并安装->打开窗口(安装更新)->选择:搜索要安装的新功能部件->新建远程站点->在“编辑远程站点”框中填入:名称(PyDev),URL(http://pydev.org/updates)->确定->完成。 出来一

2012-12-05 19:35:23 570

原创 精品资源下载

主要资源参考:http://tanzhangwen.download.csdn.net/算法(Algorithm)POJ 300多道题目源码 具体题目参考:http://poj.org/userstatus?user_id=tanzhangwenhttp://download.csdn.net/source/2854844Kmeans算法的C++实现http://download.csdn.net

2012-12-05 19:35:21 676

原创 【转】中文论文写作格式

1 题名题名应以简明、确切的词语反映文章中最重要的特定内容,要符合编制题录、索引和检索的有关原则,并有助于选定关键词。中文题名一般不宜超过20个字,必要时可加副题名。英文题名应与中文题名含义一致。题名应避免使用非公知公用的缩写词、字符、代号,尽量不出现数学式和化学式。2 作者署名和工作单位作者署名是文责自负和拥有著作权的标志。作者姓名署于题名下方,团体作者的执笔人也可标注于篇首页地脚或文末,简讯等

2012-12-05 19:35:19 711

原创 Agent建模之Repast建模编程介绍

Repast下载地址:http://www.10pig.cn/index/repast.aspxRepast J的编程使用详细内容可以参考安装目录下的how-to目录中各文件说明,api目录,demo目录的例子,简要介绍参考:http://l-eme.gdcc.edu.cn/ztzs/fzxt/4-3.htm 安装了Repast J后,在其安装目录下有如下几个文件夹:api:给出了Repast主要

2012-12-05 19:35:17 4685 5

原创 Python中数据结构

列表list是处理一组有序项目的数据结构,即你可以在一个列表中存储一个 序列 的项目。假想你有一个购物列表,上面记载着你要买的东西,你就容易理解列表了。只不过在你的购物表上,可能每样东西都独自占有一行,而在Python中,你在每个项目之间用逗号分割。列表中的项目应该包括在方括号中,这样Python就知道你是在指明一个列表。一旦你创建了一个列表,你可以添加、删除或是搜索列表中的项目。由于你可以增加或

2012-12-05 19:35:15 502

原创 图中最短路径算法

DijkstraDijkstra(迪杰斯特拉)算法是典型的最短路径路由算法,用于计算一个节点到其他所有节点的最短路径。主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止。Dijkstra算法能得出最短路径的最优解,但由于它遍历计算的节点很多,所以效率低。时间复杂度我们可以用大O符号将Dijkstra算法的运行时间表示为边数m和顶点数n的函数。Dijkstra算法最简单的实现方法是用一个链表或

2012-12-05 19:35:13 1217

原创 java操作access

就编程来讲,对于sql server,微软提供了专门的jdbc驱动程序,也就是大家平常用的那三个jar文件。但access的编程可没那么豪华,现在可用的编程方法,只是提供一个jdbc-odbc桥接器进行连接,效率就不用说了哦。    大概过程也略略罗嗦一下:  1,创建制定数据库的URL:同时配置access数据源  如: String url = "jdbc:odbc:Oblog";  2,加载

2012-12-05 19:35:11 666

原创 weka的重新编译与添加算法

weka源码编译步骤1           安装JDK环境和Java开发环境,例如Eclipse。2           安装WEKA(安装不带JRE的WEKA即可)。3           重新编译:3.1          创建工作目录。新建任意一目录在Eclipse的workspace中。3.2          准备源代码。在WEKA的安装目录中找到weka-src.jar,解压

2012-12-05 19:35:09 1085

原创 Python函数与模块(二)

函数定义函数:   def   func_name([parameters]):statement函数传递的是值,如果需要传递地址,则必须用全局变量global,只需在函数中说明即可使用默认参数值,例如:def say(message, times = 1):     print message * timessay('Hello')say('World', 5)使用关键参数,例如:def

2012-12-05 19:35:07 405

原创 Python变量与语句(一)

运算符**   幂   x的y次方    例如 3**4=81/ 表示除     //表示取整除   %表示取余布尔运算用 not    and or数据类型字符串可以用''或者""引起来,他们基本等价,没有字符型 例如 'python' "python"'''和"""为三引号,在其中的句子可以任意用单双引号或者换行\如果在一行末尾表示下一行的其实是接着本行的,不是开始新一行。它还用来

2012-12-05 19:35:05 559

原创 java中的文件输入输出

学了c/c++之后再接触java,就觉得java在输入方面有点不可思议,总是要先建立输入流再一一获取输入的信息。现在感觉其实也和C++中的文件流差不多,只是在定义文件的时候总是不要忘了异常的处理。文件输入:1.最方便的Scanner:Scanner in = new Scanner(new DataInputStream(new FileInputStream(new File("trim-dat

2012-12-05 19:35:03 483

Kmeans算法C++实现

Kmeans算法的C++实现,输入的instance的数据结构有设计为静态数组存储和动态链表存储

2010-11-23

POJ上三百多道题目程序源码

具体题目参考: http://poj.org/userstatus?user_id=tanzhangwen 本压缩文件里面有所有已经Accepted的题目的源码,主要语言为c/c++,少量java

2010-11-23

Think in Python

介绍Python语言以及怎么用Python语言来思考及编程,是英文版的好书

2010-03-14

C及C++基本函数说明

有C语言以及C++语言中系统函数的介绍、使用说明。另外还有STL中的队列、堆栈等的介绍,欢迎下载

2009-09-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除