白云机场(数据抓取)

输入输出流,正则表达式的学习
[u](代码在 学习日志 网页数据抓取)[/u]
http://xiaooman07.iteye.com/admin/blogs/476798

看了下正则表达式(正则表达式30分钟入门教程) ps:30分钟教程看了几个小时。。。最后证实作者在忽悠人,,居然在文章末尾向读者道歉。。。
作者如是说:

好吧,我承认,我骗了你,读到这里你肯定花了不止30分钟.相信我,这是我的错,而不是因为你太笨.我之所以说"30分钟",是为了让你有信心,有耐心继续下去.既然你看到了这里,那证明我的阴谋成功了.被忽悠的感觉很爽吧? - -#

总的来说很感激作者,写的真的很好,而且有很多经典的例子,从简单到难,虽然最后的几个表达式稍微有点难,不过想通以后就有一种豁然开朗的感觉啦。正则表达式真的是非常强大的工具,匹配输入字符,匹配ip地址,匹配电话号码,大概也没有匹配不了的数据,也没有想不到的匹配方法吧,,。。

从网上保存了很多网页下来,回寝室以后开始写正则表达式,,写很久想很久,最后匹配出来了,,第二天,再看表达式,,居然不知道自己在写些什么。。。。(不过总算是学会了java 正则表达式的运用)。

STEP
step1 :
从网上保存网页到本地,在本地试验正则表达式
http://xiaooman07.iteye.com/admin/blogs/476794
step2 :
将抓取到的数据输出到文本文档
http://xiaooman07.iteye.com/admin/blogs/476797
step3 :
输入url,从网页上抓取数据,输出到文本文档,并进行格式修正。。
http://xiaooman07.iteye.com/admin/blogs/476798
但是始终有个小问题,,

交易量(手) 交易金额(万元) ------- 为什么中间空了其他数据的两倍间隔啊。。。。。。


ps:在输入输出流结束一定不要忘记close();、、
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值