用C#做信息采集器还是比较简单的。用WebRequest抓取指定网页的内容,然后用正则表达式匹配出所需要的内容就可以了。 还可以将抓取规则抽象出来,对不同网页适用不同的规则,提取需要的内容。
这里以抓取CSDN Asp.Net小论坛http://forum.csdn.net/SList/ASPDotNET/ 为例做个简单的采集器。运行截图如下:
用C#做信息采集器还是比较简单的。用WebRequest抓取指定网页的内容,然后用正则表达式匹配出所需要的内容就可以了。 还可以将抓取规则抽象出来,对不同网页适用不同的规则,提取需要的内容。
这里以抓取CSDN Asp.Net小论坛http://forum.csdn.net/SList/ASPDotNET/ 为例做个简单的采集器。运行截图如下: