抓天涯!

这两天突发奇想,在做一个抓取天涯论坛帖子内容的小程序:通过输入帖子首页地址,我的CatchTianya小程序可以将天涯上这个帖子的所有页面的帖子内容(过滤所有的广告)截取并显示在我的页面中,并可以设置是否只抓取楼主的帖子内容,并可以将抓取结果文本内容复制到Windows剪贴板以及保存在一个文本文件中。

很简单的小程序,不过还挺有用的,至少对我来说,呵呵。经常看到很长的连载帖子,经常没耐心趴在电脑上一页一页翻着看,总喜欢存到文本文件中用PSP或手机慢慢看。遇到十几页甚至几十页的长贴就痛苦了,要一页一页的打开,一页一页的复制粘贴,很繁琐和累人。现在有这个小程序就方便了,只要把首页地址粘贴上,一键搞定!小有一点学以致用的感觉,还挺有成就感的,呵呵。

先贴个完成效果图吧,呵呵。

 

 

输入一个帖子的首页地址,点击Catch!

 

 

读到第3页了,呵呵

 

 

抓完收工!

 

 

 

做的过程中也遇到了不少困难,在解决这些问题的过程中也积累了些经验,记录一下。

1.如何在Javascript中使用并输出文本文件(记事本)的换行字符

网页内容截取基本上完成了,最后被一个看似很小的问题困扰了半天。这就是如何在Javascript中使用并输出文本文件(记事本)的换行字符。为方便显示,在我的网页中显示的文本内容包括部分的html控制字符,如<center>,<br>等。其他的字符都很容易的替换了,但是<br>的替换却出现了问题。我居然找不到如何在Javascript中实现文本文件的换行。我先试了/n,不好使,然后又百度Google一通,/n/r等等一堆字符都不行,记事本很执着的一次次显示这小黑块。我保存了一个含有换行的文本文件,然后用UltraEdit打开查看16进制编码,发现是0d0a。然后又找了半天,终于找到了Javascript中将16进制数转换成字符的方法,unescape!这样我先保存一个回车的变量var strEnter=unescape("%0d%0a"),然后将<br>替换成这个变量。搞定!

 

过两天准备传到个免费空间上去,让别人也能用用,hoho

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
SmartSniff允许你捕获通过你的网络适配器的TCP/IP数据包,并且可以以客户端和服务器之间的会话序列的形式查看所捕获取的数据。你可以使用两种模式查看TCP/IP会话:ASCII模式(针对以文本为基础的协议,例如HTTP、SMTP,POP3和FTP。),十六进制转储模式(针对以非文本形式为基础的协议,例如DNS)。 SmartSniff 提供3种方法进行捕获TCP/IP数据包: 1. 原始套接字 (只适用于Windows 2000/XP或更高版本): 不用安装任何捕获驱动就可以捕获你网络上的TCP/IP数据包。这种方法有一定的局限性和问题。 2. WinPcap捕获驱动程序: 可以捕获所有Windows操作系统上的TCP/IP数据包。(Windows 98/ME/NT/2000/XP/2003/Vista)如果要使用这种方法,请先从官方网站下载并安装WinPcap捕获驱动程序。(WinPcap是免费的开源捕获驱动。) 一般来说,SmartSniff更适合使用这种方法进行捕获TCP/IP数据包,会比原始套接字更好。 3. 微软网络监视驱动程序(只适用于Windows 2000/XP/2003): 在Windows 2000/XP/2003下,SmartSniff可以使用这个微软提供的免费捕获驱动程序,但是这个驱动程序不是默认安装的,你必须使用以下其中一种方法进行手动安装: * 方法1:根据微软网站介绍的方法,从Windows 2000/XP的CD-ROM中安装。 * 方法2(只适用于XP):下载并安装Windows XP Service Pack 2支持工具。在这个补丁包中其中一个工具是netcap.exe。当你首次运行这个工具时,网络监视驱动程序会自动被安装到你的系统中。 4. 微软网络监视驱动程序 3: 微软提供了可以在Windows 7/Vista/2008下运行的新版本微软网络监视驱动程序(3.x)。从1.6版起,SmartSniff可以使用这个驱动程序进行捕获网络流量。 新版本的微软网络监视驱动程序可以从微软的网站上下载。 注意:如果WinPcap已经安装到你的系统上,并且你想使用微软网络监视驱动程序的方法,建议使用/NoCapDriver命令运行SmartSniff,因为在WinPcap也加载的情况下,微软网络监视驱动程序可能不可以正常工作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值