这几天试用了一下哥们的一个自动采集软件myspider,发现很好用,功能非常强大,具体介绍如下:
MySpider介绍
信息采集是利用计算机软件技术,针对定制的目标数据源,实时进行信息采集、抽取、处理,从而为各种信息服务系统提供数据输入的整个过程。
MySpider自动采集系统是一款功能强大,使用方便的信息采集与监控软件。可以实现对各种不同类型的网站进行信息的采集整理,用户可自定义各种采集规则配置以适应不同类型较复杂的网站。
系统应用领域:
1、搜索引擎与垂直搜索
2、综合门户与行业门户
3、电子政务与电子商务
4、知识管理与知识共享
5、企业竞争情报系统
6、BI商业智能系统
7、信息咨询与信息增值
8、信息安全和信息监控
系统特点:
1、支持自定义表单。
2、支持自适应采集。
3、支持集群采集。
4、支持各种报表导出。
5、支持仿人工式的随机采集数据。
6、支持自定义阅读模板。
7、支持登陆、代理采集。
8、支持各种列表分页采集。
9、支持各种内容分页采集。
10、支持各种排重过滤。
11、各种采集日志和采集源日志监控。
12、支持采集网站、采集源管理。
13、支持采集图片、附件、音频,视频等文件或附件。附件与正文自动映射与关联。
14、支持多种附件保存方式,可保存至磁盘或数据库。
15、支持附件的压缩存储。
16、支持对采集来的信息进行二次加工。支持采集内容的自动排版。
17、真正的多用户采集系统,每个操作都要记录操作内容、操作人以及操作时间。
18、真正的多线层、多任务采集、集群采集。
19、支持海量数据采集
20、软件实用、易用、功能强大
21、可移植、可扩展、可定制
网址:http://www.myspider.org.cn