Python爬虫编程实践
一些非常有趣的python爬虫例子
fire_i_ce
想但V自行车V的V的想
展开
-
Task04 selenium实战之爬取腾讯新闻热点精选
话不多说,切入正题。 基于对https://news.qq.com/热点精选的分析,获取热点精选的文本和url信息还是比较简单的,selenium模拟浏览器,ajax加载,利用bs4进行页面解析便可实现,代码如下: import time import csv from selenium import webdriver driver=webdriver.Chrome(executabl...原创 2020-04-27 21:46:38 · 286 阅读 · 0 评论 -
Task02 正则表达式
一、介绍: 正则表达式是用来简洁表达一组字符串的表达式 正则表达式是一种通用的字符串表达框架 正则表达式是一种针对字符串表达“简洁”和“特征”思想的工具 正则表达式可以用来判断某字符串的特征归属 二、语法: 正则符号 含义 . 表示任何单个字符 [ ] 字符集,对单个字符...原创 2020-04-23 22:56:20 · 272 阅读 · 0 评论 -
Task01 豆瓣电影Top 250
1、翻阅网页可找到豆瓣电影 Top 250,网页链接为: https://movie.douban.com/top250?start=0&filter= 网页特点: 每页25个,共10页 网址start=0数字部分按照每次累加25进行分页 网页链接获取url代码: for site in range(0, 250, 25): ...原创 2020-04-21 18:19:22 · 578 阅读 · 0 评论