Python爬虫
文章平均质量分 57
爬虫入门的训练
辞树 LingTree
这个作者很懒,什么都没留下…
展开
-
zzu打卡
1. 环境准备1) python环境2) webdriver库3) chrome浏览器4) chromedriver并配置环境 参考chromedriver配置2. 脚本代码from selenium import webdriverimport randomfrom time import sleep# 选择Chrome浏览器driver = webdriver.Chrome()# 这是我学校的打卡网页,需自行修改driver.get("https...原创 2022-03-22 22:17:33 · 1090 阅读 · 0 评论 -
正则表达式学习总结&&踩坑
部分转自菜鸟教程正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与运算符可以将小的表达式结合在一起来创建更大的表达式。正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择...原创 2019-12-31 15:52:23 · 297 阅读 · 1 评论 -
Python 爬虫库以及库函数总结&&踩坑
1. Re库的基本使用 Re库介绍: Re库是Python的标准库,主要用于字符串匹配。 调用方式:import re 正则表达式的表示类型: raw string类型(原生字符串类型): re库采用raw string类型表示正则表达式,表示为:r'text' 例如:r'[1-9]\d{5}' ...原创 2019-12-31 11:41:27 · 1151 阅读 · 0 评论 -
Python 爬虫踩坑总结
坑一: requests 库的安装与导入IDE : Pycharm需要安装requests库。 解决方法: win+r 输入 cmd。在命令行输入 : pip install requests。导入Pycharm(!坑)。之前安装好了requests库,但是在Pycharm中依旧无法运行,报错显示没有requests库。解决方法:可能是没有导入该库。在File - Setting ...原创 2019-12-31 11:12:22 · 365 阅读 · 0 评论 -
Python爬虫入门——第一个爬虫实例
目录开发爬虫的步骤:实例开发与踩坑总结踩坑总结:开发实例:开发过程:第一步,获取目标数据第二步,分析数据加载流程第三步、下载数据第四步、清洗数据第五步、数据持久化写在最前: 特别鸣谢全书网给了爬虫少年一个入门的机会,练习的时候,爬了好几个网站,都在中间被封了,导致中途代码报废,只能重新找网站重构代码从头做起。 感谢B站...原创 2019-12-27 10:54:27 · 5287 阅读 · 2 评论