自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 python爬虫爬取百度贴吧帖子

最近学习python,就利用python做一个简单的爬虫项目巩固自己学习的知识。本人实现的思路:1. 取得包含帖子主题的全部页面;2. 从页面中提取帖子URL保存到队列中,每个URL就是一个帖子;3. 从队列中依次提取URL,获取帖子中的内容。具体实现:首先,获取页面的全部内容。本来我使用的是urllib,后面换成了requests,个人感觉这个模块方便了很多。def getPageAllCont...

2018-05-15 11:15:33 714

原创 Python3 urllib.request读取带中文的链接

两种方法,一种是将中文单独拿出进行处理,然后进行字符串拼接;另一种是直接对链接进行修改。第一种方法,将中文单独拿出# -*- coding:utf-8 -*-from urllib.parse import quoteurl = 'http://www.example.com/api.php?text=中文在这里'x = '中文在这里'x = quote(x)print(x)y ...

2018-05-12 16:15:24 2950 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除