qq_43574052-CSDN博客

原创 Python爬虫--Scrapy框架

这两天学习了Scrapy框架，它是一种专门用于爬虫的框架。在安装完Scrapy后，首先在命令行里创建一个项目：创建好项目后，便可以看到scrapy的结构大概是这样的：第一步需要在items.py这个文件里设置爬取内容分成的各个属性： import scrapy class DmozItem(scrapy.Item): # define the fields for your ...

2019-08-14 21:15:32 118

原创 Python爬虫----代理ip的测试

今天针对ip的检测写出了一段代码： from urllib import request, error from bs4 import BeautifulSoup import re if __name__ == '__main__': url = 'http://ip.webmasterhome.cn/' # 使用代理的步骤 # 1.设置代理IP,进入代理网站选...

2019-08-13 20:59:51 394

原创 Python爬虫---制作爬取网页图片的爬虫

最近在b站上学习了python基础编程入门，其中比较有意思的是用python写爬虫的项目代码如下： import urllib.request from bs4 import BeautifulSoup import re import ssl import os def find_img(page_url): html = openurl(page_url) soup...

2019-08-12 17:50:56 246

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人