- 博客(556)
- 资源 (24)
- 收藏
- 关注
基于Htmlparser的天气预报程序(续)
zz:http://www.iteye.com/topic/642332 结合网上找的一个查ip的webservice得到本机所在的城市,得到当天天气。在试验室发现了一个小问题 就是程序在有些同学的电脑跑的动,在有些同学的电脑跑不动,后来查了资料是jaxb-api.jar的问题,jdk提供的是2.0的所以起冲突了,说你下一个新的放在lib目录下就解决问题了。 ...
2010-04-14 13:53:22
76
CSV
Smooks用于处理XML与非XML(CSV,EDI,Java等)的一个Java框架与引擎。Smooks能够用于各种数据格式的转换:XML to XML,CSV to XML,EDI to XML,XML to EDI,XML to CSV,Java to XML,Java to EDI,Java to CSV,Java to Java,XML to Java,EDI to Java...
2010-04-13 17:41:03
111
转载Nucth学习链接
http://lucene.apache.org/nutch/http://today.java.net/pub/a/today/2006/01/10/introduction-to-nutch-1.html一些链接(对菜鸟来说,都很不错哟): Linux下安装Lucene(详细)http://blog.c1gstudio.com/archives/142 Windows下N...
2010-04-13 17:07:28
173
opencsv java导入csv与xls文件总结
入文件若为二进制格式的csv或xls文件需要用jxl.jar包来解析,若文件为文本格式逗号分隔的csv文件则需要用opencsv.jar包来解析。如何区分文件为二进制格式,简单的方法可以右键使用记事本打开,若为乱码则为二进制文件,这样的文件只能使用office的excel工具打开;而文本格式逗号分隔的csv文件使用记事本就可以打开。下面为导入两种格式文件的代码示例: 1...
2010-04-13 16:13:06
247
opencsv开源 CSV文件操作包简介
opencsv is a very simple csv (comma-separated values) parser library for Java. It was developed because all of current csv parsers I've come across don't have commercial-friendly licenses. o...
2010-04-13 16:10:28
234
httpclient(校内网)
Java code<!-- Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->package com.lihan.dao;import java.io.Buffer...
2010-04-13 15:10:10
80
httpclient(校内网)
httpclient(校内网),大家帮忙看看我的httpclient怎么发不到对方站内信呢?博客倒是能发,但是就是站内这里出问题~Java code package com.lihan.dao; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; i...
2010-04-13 15:10:02
83
HTTPClient模拟登陆人人网
zz:目的:http://www.iteye.com/topic/638206使用HTTPClient4.0.1登录到人人网,并从特定的网页抓取数据。总结&注意事项: HttpClient(DefaultHttpClient)代表了一个会话,在同一个会话中,HttpClient对cookie自动进行管理(当然,也可以在程序中进行控制...
2010-04-13 14:58:58
129
数据库建模工具:PowerDesigner与Rose详解教程
一、 二者的出身 作为世界最著名的两大CASE工具,Rational Rose和PowerDesigner的名声可谓如雷贯耳。Rose是当时全球最大的CASE工具提供商Rational的拳头产品,UML建模语言就是由Rational公司的三位巨头Booch、Rumbaugh和Jacobson发明的,后来Rational被IBM收购,所以Rose 可谓出身名门,嫁入豪族。而...
2010-04-13 14:27:12
895
HtmlCleaner API
HtmlCleaner APICreate cleaner instance: Constructor or method Purpose HtmlCleaner() Create cle...
2010-04-13 13:40:30
181
htmlcleaner惯用法
Common usageTipically the following steps are taken:// create an instance of HtmlCleanerHtmlCleaner cleaner = new HtmlCleaner(); // take default cleaner propertiesCleanerProperties pro...
2010-04-13 13:39:17
150
htmlcleaner惯用法
Common usage Tipically the following steps are taken:// create an instance of HtmlCleanerHtmlCleaner cleaner = new HtmlCleaner(); // take default cleaner propertiesClean...
2010-04-13 13:39:03
149
htmlcleaner 使用示例.
原文出处:http://blog.chenlb.com/2008/11/htmlcleaner-use-demo.html<!-- google_ad_section_start -->编程的时候,有时数据源从html来。那就要对html分析提取数据。好在java社区里有好有相关库来解析html,经使用比较:个人觉得 htmlcleaner 比 htmlparser ...
2010-04-13 13:10:43
105
UML用例图中包含、扩展和泛化三种关系详解
包含关系:比如在自动售货机里面,向柜里增加货品,那么必然包括打开柜门和关上柜门, 这就是包含关系,也就是说做基事件的时候,必然会做它所包含的事件。扩展关系:是说做基事件之后,我可能做扩展事件,也可能不做。 用例图主要用来图示化系统的主事件流程,它主要用来描述客户的需求,即用户希望系统具备的完成一定功能的动作,通俗地理解用例就是软件的功能模块,...
2010-04-12 21:13:06
1535
UML 实践——用例图、顺序图、状态图、类图、包图、协作图
UML实践——用例图、顺序图、状态图、类图、包图、协作图面向对象的问题的处理的关键是建模问题。建模可以把在复杂世界的许多重要的细节给抽象出。许多建模工具封装了UML(也就是Unified Modeling Language™),这篇课程的目的是展示出UML的精彩之处。UML中有九种建模的图标,即:用例图类图对象图顺序图协作图状态图...
2010-04-12 20:33:29
519
HtmlParser初步研究2
// 获取一个网页上所有的链接和图片链接 public static void extracLinks(String url) { try { Parser parser = new Parser(url); parser.setEncoding("gb2312");//过滤 <frame> 标签的 filter,用来提取 f...
2010-04-12 15:47:54
81
开源网络蜘蛛spider(转载)
spider是搜索引擎的必须模块.spider数据的结果直接影响到搜索引擎的评价指标.第一个spider程序由MIT的Matthew K Gray操刀该程序的目的是为了统计互联网中主机的数目spider定义(关于Spider的定义,有广义和狭义两种).狭义:利用标准的http协议根据超链和web文档检索的方法遍历万维网信息空间的软件程序. 广义:所有能利用http协议检索w...
2010-04-12 15:42:54
168
基于Spindle的增强HTTP Spider
zz:http://www.iteye.com/news/1731构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,有任何意见及建议均可Email联系我 (kaninebruno@hotm...
2010-04-12 15:33:35
174
Cobra: Java HTML 解析器
Cobra 简介:Cobra是一个HTML工具包。它包含一个纯Java HTML DOM 分析器和一个页面表现引擎。Cobra支持HTML4,Javascript 和CSS2。声明的新特征有:实现了W3C HTML DOM Level 2接口。能够解析某些浏览器所识别的 "street HTML"。能够在headless模式中被使用。当...
2010-04-12 15:32:56
393
用htmlparser分析并抽取正文
我这次要介绍的是如何抽取正文,这部分是最为核心的.因为如果不能很好的提取原有文章的内容和样式,那么搜索出来的东西就会惨不忍睹.根本就没有使用价值 在做正文抽取模块之前我曾经参考过很多抽取模式,有配置模版的,有搞视觉匹配的.有搞关键字识别的.我挨个做了分析首先配置摸版是不太现实的,因为我在搜索技术资讯的时候,根本不知道会搜索到哪个网站,也根本没精力去配置摸版.所以这个行不通...
2010-04-12 15:26:39
90
HtmlParser初步研究
目的是快速入手,而不是深入研究,做了一下整理,和大家共同讨论一下。一,数据组织分析:HtmlParser主要靠Node、AbstractNode和Tag来表达Html,因为Remark和Text相对简单,此处就将其忽略了。Node是形成树结构表示HTML的基础,所有的数据表示都是接口Node的实现,Node定义了与页面树结构所表达的页面Page对象,定义了获取父、子...
2010-04-12 15:18:09
86
基于Htmlparser的天气预报程序
htmlparser是一个纯的java写的html解析的库,它不依赖于其它的java库文件,主要用于改造或提取html。它能超高速解析html。该程序是基于命令窗口模式,用htmlparser去抓取页面上的天气信息。这是网页的截图 通过观察地址栏,我们可以知道页面接收一个中文的参数,这个参数为城市名,所以我们在程序中可以接收用户传进来的城市名来的道相对应的网页。...
2010-04-12 15:16:28
88
垂直化B2C长得快
B2C 网站 商务 垂直 电子 在北京,平均每4罐婴儿奶粉就有1罐是通过他们的B2C网站销售的。“红孩子”长得快,已经引起越来越多的风险投资的关注,去年第三季度,国内风险投资领域最大的一个“红包”——2500万美元就青睐了“红孩子”。 “红孩子”的快速长大并非个案。据了解,去年之前,线上B2C用户在线购买的商品种类以图书、音像等出版物以及虚拟产品为主,当当、卓越等...
2010-04-09 15:39:59
158
Twitter推出名为“Gizzard”的分布式数据存储框架
最近Twitter官方博客撰文称,很多现代网站需要更快地访问大量数据,无法通过单一计算机对这些数据进行有效存储。应对措施之一就是对这些信息进行分割,分别存储在不同的计算机上。作为数据分割的替代方案之一,Twitter已经开发了一个框架,用来代替自定义开发的数据存储系统或未经测试的开源备选方案,然后对外开放代码。Twitter已经从以往的数据存储开发经验中提出一个名为Gizzard的Sc...
2010-04-09 09:28:39
192
一刻钟精通正则表达式
想必很多人都对正则表达式都头疼。今天,我以我的认识,加上网上一些文章,希望用常人都可以理解的表达方式来和大家分享学习经验。 想必很多人都对正则表达式都头疼。今天,我以我的认识,加上网上一些文章,希望用常人都可以理解的表达方式来和大家分享学习经验。 开篇,还是得说说 ^ 和 $ 他们是分别用来匹配字符串的开始和结束,以下分别举例说明: "^The":...
2010-04-08 11:04:09
100
JAVA开源项目
http://best-java-source.whyandhow.org/ Ajax:异步JavaScript和XMLAOP面向方面编程Java 博客系统Bug与事件跟踪系统Java系统构建工具Java机器码工具Java缓存工具统计图表与报表工具即时聊天工具Java CMS内容管理系统...
2010-04-05 13:32:36
70
HttpClient cookie的问题
今天想写个模拟web登陆的压力测试代码,首先想到的是 httpclient 因为做压力测试没必要模拟页面操作,只要对server造成loading就行了。公司的系统架构是SSH的,我的想法是先用n个client登陆SSO,然后把n个client扔到n个线程,然后n个线程一起start.开始一直报CircularRedirectException的exception. debu...
2010-04-05 12:27:24
163
HttpClient 学习整理
HttpClient 学习整理 HttpClient 是我最近想研究的东西,以前想过的一些应用没能有很好的实现,发现这个开源项目之后就有点眉目了,令人头痛的cookie问题还是有办法解决滴。在网上整理了一些东西,写得很好,寄放在这里。HTTP协议可能是现在 Internet 上使用得最多、最重要的协议了,越来越多的 Java 应用程序需要直接通过 HTTP协议来...
2010-04-05 11:36:50
79
httpclient之 cookies问题解决办法1
想试试HtmlUnit在测试网页上的表现,访问一个网页跳转到下一个网页之后,总是返回在server上找不到的页面,用IE访问就是好的。另外有个奇怪的现象,在IE访问网页之后,再run写好的HtmlUnit代码就能顺利通过。关了IE之后,10分钟左右,代码都能通过。超过这个时间之后,就怎么折腾也通不过。 根据这个现象分析,感觉很象是cookie在捣鬼。cookie有效的时候,H...
2010-04-05 11:32:55
397
HttpClient Cookies
HttpClient Cookies简介 HttpClient支持自动管理Cookies,允许服务端设定Cookies,并在请求时自动返回客户端的Cookies信息。客户端也可以手动的设置Cookies发送到服务端。 不幸的是,同一时间内有太多的Cookies...
2010-04-05 11:18:50
83
流程图和活动图的区别
1 流程图着重描述处理过程,它的主要控制结构是顺序、分支和循环,各个处理之间有严格的顺序和时间关系;而活动图描述的则是对象活动的顺序关系所遵循的规则,它着重表现的是系统的行为,而非系统的处理过程。 2 活动图能够表示并发活动的情形,而流程图做不到。3 活动图是面向对象的,而流程图是面向过程的。 ...
2010-04-01 19:06:32
239
活动图的作用(Activity Diagram)的作用到底是什么?
今天我画活动图,有一种越画越糊涂的感觉,甚至开始问自己画活动图的作用,活动图中究竟怎样来划分手工需做的事和信息系统应该完成的功能?问题点数:50、回复次数:13 活动图是基于对象的状态变迁所绘制的视图。它的主线是状态的变化,而不是时间,而时序图则是对象在不同时间段内的表现。你画活动图前,一定要有use case diagram, 针对use...
2010-04-01 19:04:51
5913
Activity diagram
Activity diagrams show the procedural flow of control between two or more class objects while processing an activity. Activity diagrams can be used to model higher-level business process at...
2010-04-01 19:02:48
115
UML之Activity Diagram
A simple example of an activity diagram A subsidiary activity diagram Invoke the subsidiary activity If you want to show who does what, you can divide an activity diagraminto parti...
2010-04-01 19:01:36
130
JAVA网络编程Socket常见问题 【长连接专题】
一.网络程序运行过程中的常见异常及处理第1个异常是java.net.BindException:Address already in use: JVM_Bind。该异常发生在服务器端进行new ServerSocket(port)(port是一个0,65536的整型值)操作时。异常的原因是以为与port一样的一个端口已经被启动,并进行监听。此时用net...
2010-03-18 16:30:25
138
Doors 和RequisitePro使用比较报告(个人观点)
今天读到许多介绍需求管理工具的文档,前些年试用过两款工具,把一些新的体会张贴出来,供大家议论。这些工具近年来肯定又有了新的改进,更全的功能请大家参考工具的帮助文档。 比较内容Telelogic DoorsIBM Rational RequisitePro结论...
2010-03-17 17:47:31
211
来,讨论一下怎么写需求文档吧
先谈谈我的想法。一、要讨论怎么写需求文档,首先就的搞清楚需求的构成,我是这么分的:1、功能需求;2、非功能需求或技术需求;我一般把功能需求划分为几个部分:a、业务过程;b、业务规则;c、业务数据;非功能需求(技术需求)我就不多说了,大致就是可用性,可靠性,性能,可支持性等等。二、弄清楚需求的构成后,我们就得考虑以什...
2010-03-17 17:06:21
142
需求管理工具试用 – CaliberRM
需求管理工具试用 – CaliberRM先说说我的问题:目前项目中一直使用HP内部的RTM工具(需求跟踪矩阵)结合CR (Change Request) Tracking Sheet来进行管理需求管理工作,基本状况是:项目分为多个子系统,针对一个需求模块编写一个SRS (有独立的需求编号)SRS文档中包括了用户需求,系统需求和非功能需求。唯一...
2010-03-17 16:57:35
223
Vaadin独家第一手资源-Vaadin-api.chm
2010-02-05
HACK\万网,让我说你什么好!!!本站学员经典作品.mhtHACK\万网,让我说你什么好!!!本站学员经典作品.mht
2009-08-22
HACK\总结一下入侵的14种可利用方法.htmHACK\总结一下入侵的14种可利用方法.htm
2009-08-22
HACK\fhod's Blog 一个注射点,一个webshell甚至系统权限 -.mht
2009-08-22
Cmd模式下的入侵技术大全Cmd,模式,入侵,技术 - 网站入侵 - 冰兰技术论坛 - 冰兰社区-冰兰官方论坛-冰兰安防论坛.htm
2009-08-22
[转载]php注入专题 脚本安全[ Web Application ].mht[转载]php注入专题 脚本安全[ Web Application ].mht
2009-08-22
[转载]LOG备份与备份差异的对比!.mht[转载]LOG备份与备份差异的对比!.mht
2009-08-22
[转载]《SQL Injection规避入侵检测技术总结》 邪恶八进制信息安全团队官方讨论组 努力为祖国的信息安全撑起一片蓝天 - EvilOctal Security Team - E_S_T.htm
2009-08-22
[原创]新型注入方式直击网络——session注入探究 邪恶八进制信息安全团队官方讨论组 努力为祖国的信息安全撑起一片蓝天 - EvilOctal Security Team - E_S_T.mht
2009-08-22
[原创]如何突破数据库Loop防下载实例 邪恶八进制信息安全团队官方讨论组 努力为祖国的信息安全撑起一片蓝天 - EvilOctal Security Team - E_S_T.mht
2009-08-22
[内酷族]教程站-Mysql教程之MYSQL用户root口令为弱口令又一入侵办法- NKZU_com.htm
2009-08-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅