Python中常用的爬虫框架

利用Python中一些爬虫框架可以更加快速地写出我们需要的爬虫程序,常见的Python爬虫框架有:

1. Scrapy:这是一套比较成熟的Python爬虫框架,Scrapy官网:http://Scrapy.org/

2.Crawley:可以比较高效地攫取互联网对应的内容,官网:http://project.crawley-cloud.com/

3.Portia:可以可视化地爬取网页的框架,可以下载到本地,也可以直接使用网页版本(需要注册帐号),Portia的官网:https://portia.scrapinghub.com/

4.newspaper:用来提取新门卫新闻,文章及内容分析的Python爬虫框架,由第三方开发。git上地址:https://github.com/codelucas/newspaper

5.Python-goose:git上的地址:https://github.com/grangier/python-goose

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值