自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

转载 python3学习(3):ID 遍历爬虫

从python3学习(2)中可知所有爬取的网站URL只有在结尾处有区别,因此,可以利用该弱点来遍历访问所有URL。 ### 二、 ID 遍历爬虫,利用网站结构的弱点,轻松访问所有内容。 # Downloading: http://example.webscraping.com/places/default/view/Afghanistan-1 # Downloading: h...

2018-06-29 22:06:00 182

转载 python3 学习(2):在网站地图爬虫时的cannot use a string pattern on a bytes-like object 问题的解决方法...

python3.6.5 + pycharm 注意: 一、python3里的 urllib2 已经没有了,改为了urllbi.request,因此,直接导入import urllib.request即可。 二、必须对正则表达式里的引用变量进行格式变换.decode('utf-8'),否则会报错说 不能在一个字节类的对象上使用字符串格式。 如下代码所示。 ...

2018-06-29 21:10:00 175

转载 python3学习(1):用python编写一个统计分析某text文件里的字、空格、其他字符的数量,并统计排序频率最高的前10个字...

## 本游戏旨在计算并打印出一个文件中内容的统计数据。比如,以只读方式统计并打印 出文件包含多少个字符、行和单词,# 并统计出现次数最多的前10个单词,按出现次数排列好。(文件类型主要是 .txt .xls .doc-- written by LiSongboWords = {'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', '...

2018-06-29 11:20:00 391

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除