自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 Python爬取芜湖-政务新闻

最近,接到单位给的任务,要爬取芜湖市政务新闻网的所有新闻,并且是要从一个新闻中截取到一段最长的文字。 明确需求——规划思路——编写代码——后期优化 1、明确需求 爬取的是芜湖新闻网的政务新闻,具体图片如下: 很明显的能发现,URL的末尾是页数,由此爬取全部新闻不在话下。 本来爬了100多条数据的时候,出现了403禁止访问,以为要加代理池或者cookies池,后来发现只要在循环的时候设置...

2019-10-11 21:21:05 296

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除