Python爬虫入门教程 80-100
这里是梦想橡皮擦 Python爬虫系列的第80篇,点击图片看全部博客
写在前面
原计划继续写一篇Portia的使用博客,结果在编写代码途中发现,在windows7的DockerToolbox里面使用Portia错误实在是太多了,建议大家还是在Linux虚拟机或者直接在服务器上去运行。否则太耗费精力了~
今天我们转移一下,介绍一款newspaper
newspaper
github地址 : https://github.com/codelucas/newspaper
看名字应该能猜到和报纸/新闻有关系,这个库主要用于文章爬取和整理,国内的一个大佬做的,当然他的github上也贴上了其他开发者的推荐
例如requests库的作者在推特上的推荐语
“Newspaper is an amazing p