![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
zero林零
这个作者很懒,什么都没留下…
展开
-
python编码获取
不同的网站有不同的编码方式,同时,当我们从从服务器获取编码的编码可能跟网页中声明的编码又不一样,所有我们需要编写一个工具里来获取网页的编码方式 这里主要说明一个获取编码的小工具chardet 安装方式:pip install chardet (sudo) 使用chardet.detect()方法“` # -- coding: utf-8 --import urllib impo原创 2016-09-25 19:20:19 · 215 阅读 · 0 评论 -
python爬虫入门简单爬虫
python爬虫入门,使用urllib爬取一个网站的图片。 用beautifulsoup来解析文档中的链接、 使用urllib来打开并进行下载图片 使用多线程同时对网页进行爬去和下载 程序解构,程序主要是从网站的一个网页开始,首先获取网站的所有图片的主链接放到一个集合里面,然后打开这些图片的链接下载里面的图片,其中获取图片分类的主链接用了一个线程,然后获取所有的图片的地址使用了一个链接,最后使用三个原创 2016-09-25 19:59:52 · 319 阅读 · 0 评论