Python爬虫
文章平均质量分 59
小花同学啦啦啦
学python的渣渣
展开
-
Python爬虫实例2
Python爬虫实例2爬取豆瓣电影TOP250(https://movie.douban.com/top250)的相关内容step1 准备工作目标:爬取豆瓣电影TOP250的电影名称、豆瓣评分、评价数、电影概况、电影链接等分析:第一页URL:https://movie.douban.com/top250,展示了排行1-25的电影;第二页URL:https://movie.douban.com/top250?start=25&filter=,展示了排行26-50的电影;…获取TOP原创 2021-10-16 14:24:10 · 574 阅读 · 1 评论 -
Python爬虫实例1
Python爬虫实例1爬取猫眼电影TOP100(http://maoyan.com/board/4)的相关内容step1 准备工作目标:爬取猫眼电影TOP100的电影名称、时间、评分、图片分析:第一页URL:https://maoyan.com/board/4,展示了排行1-10的电影;第二页URL:https://maoyan.com/board/4?offset=10,展示了排行10-20的电影;…获取TOP100,需要分开请求10次,参数offset分别为:0,10…90step原创 2021-10-09 10:19:23 · 1171 阅读 · 0 评论 -
Python爬虫学习笔记2
Python爬虫学习笔记2part2 解析内容1.正则表达式1.1常用的匹配规则1.2常用的几个方法方法matchsearchfindallsubcompile功能从字符串起始位置匹配正则表达式扫描整个字符串,返回第一个成功匹配的结果扫描整个字符串,返回匹配正则表达式的所有内容修改文本将正则字符串编译成正则表达式对象参数第一个传入正则表达式,第二个传入要匹配的字符串同match同match第一个需要修改字符串的正则表达式,第二个替换成的字符串原创 2021-10-08 14:51:06 · 75 阅读 · 0 评论 -
Python 爬虫学习笔记1
Python 爬虫学习笔记1获取URL的几种方法(以百度为例)1.库 urllib1.1 urlopenimport urllib.requesturl = "http://www.baidu.com"response = urllib.request.urlopen(url)print(response.read().decode('utf-8'))1.2 Requestimport urllib.requesturl = "http://www.baidu.com"req原创 2021-10-08 13:55:11 · 52 阅读 · 0 评论