爬虫
文章平均质量分 72
是垚不si壵
这个作者很懒,什么都没留下…
展开
-
掌握urllib.parse模块及常用函数
目录一、功能介绍二、三、实例一、功能介绍二、三、实例原创 2021-08-01 16:31:00 · 1101 阅读 · 0 评论 -
掌握函数urlopen()的用法
目录一、函数功能二、语法格式三、实例一、函数功能urllib.request 定义了一些打开 URL 的函数和类,包含授权验证、重定向、浏览器 cookies等,可以模拟浏览器的一个请求发起过程,我们可以利用urllib.request 的 urlopen 方法实现对目标URL的访问。二、语法格式urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context原创 2021-07-31 09:38:49 · 4083 阅读 · 0 评论 -
爬虫理论知识准备
学习路线python基础编程知识HTML页面的内容抓取(数据抓取)HTML页面的数据提取(数据清洗)Scrapy框架以及 scrapy-redis 分布式策略原创 2021-07-31 08:51:21 · 141 阅读 · 0 评论 -
用Python从豆瓣电影TOP榜单爬取网页信息
问题:从豆瓣电影中提取数据,并保存到表格中解决代码:# encoding : utf-8"""@author: LY@contact: 13904442175@163.com@software: PyCharm@file: DouBan_movieTOP250.py"""from bs4 import BeautifulSoup # 网页解析,获取数据import re # 正则表达式,进行文字匹配`import urllib.request, urllib.error # 制原创 2021-07-14 16:05:17 · 1104 阅读 · 0 评论