- 博客(0)
- 资源 (6)
- 收藏
- 关注
网络爬虫爬虫软件
需要加载一个字典文件,此字典文件在爬虫程序中要求放在此目录结构下:
c:\dictionary\dictionary.txt,词典默认认为是按照词语长到短的顺序排列的
2、此爬虫程序爬到的网页内容存储到数据库中,运用的是SQL Server 2005
3、程序中运用了基于字符串匹配的分此方法中的正向最大匹配法
4、此爬虫程序采用的是广度优先的搜索方法搜索网络中的网页
2012-04-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人