Python网络爬虫实战
专栏中以各个项目为基础,介绍各种爬虫技术
玖__.
这个作者很懒,什么都没留下…
展开
-
Python对接MySQL数据库
文章目录基本操作DDLDMLDCL 基本操作 对接数据库,首先要创建链接。获取游标对象进行处理。 db = pymysql.connect(host='localhost', user='root', password='root') cursor = db.cursor() DDL 创建数据库 cursor.execute("create database spiders default character set utf8") 创建表 sql = 'create table student原创 2021-02-12 01:45:17 · 113 阅读 · 0 评论 -
猫眼电影排行获取
猫眼电影排行获取 本文基于Python下Requests库以及XPath解析模式获取猫眼电影排行。 构造请求,获取响应 在基本的爬虫申请中,第一步都是要构造请求,获取响应。而在Requests库中,获取响应需要用到get(),post(),delete()等方法,与Web中提交请求的方式重名。此处我们使用GET方式获取请求,并且构造Session使得每次GET都使用同一个Cookies,这样的好处是不易被服务器端识别出是爬虫从而拒绝访问。 def GetResponse(offset, session):原创 2021-01-30 14:30:33 · 242 阅读 · 0 评论