基于p2p流媒体技术的 信息检索查询系统的设计与实现。找相关的资料都找了几天了
把相关资料贴在下面:
抓取网页内容:
CInternetSession获得网页内容 http://bbs.csdn.net/topics/340170259
通过socket 获得网页内容 http://wenku.baidu.com/view/e5158044be1e650e52ea9919.html
正则表达式入门: http://www.oschina.net/question/12_9507
中文分词系统,分词效果相当好: http://download.csdn.net/detail/lilang66/5237025
理解p2p NAT打洞技术: http://download.csdn.net/detail/lilang66/5250873
提取网页内的超链接例程: http://download.csdn.net/detail/lilang66/5250857