![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
个人笔记本
文章平均质量分 57
-DiamondK-
热爱即意义
展开
-
个人笔记本 | 文件管理
文章目录遍历当前目录下的文件遍历当前目录树下的所有文件与文件夹只遍历地址应用:压缩文件夹遍历地址以及获取属性应用:遍历最大最小创建日期或修改日期路径、文件名、扩展名的处理分离路径路径转换文件名与扩展名匹配文件名与扩展名分离应用:当前程序的路径、文件名与扩展名的输出应用:关于os.scandir()的文件路径、文件名与扩展名的输出文件和文件夹的复制复制文件复制文件夹 遍历当前目录下的文件 import os for file in os.scandir(): # 可填其他路径 print(file.name原创 2021-08-04 22:24:54 · 134 阅读 · 0 评论 -
个人笔记本 | 网络爬虫 | 目录
开发者工具介绍 选择元素的方法 request爬虫 selenium自动化测试原创 2021-08-01 18:48:11 · 67 阅读 · 0 评论 -
个人笔记本 | 网络爬虫 | 开发者工具介绍
网络爬虫爬虫基础知识requests爬虫框架selenium自动化测试 爬虫基础知识 右键检查(或F12) Headers:数据包请求头(发出请求的相关信息) General URL:请求地址 Request Method:请求方式,分为get请求和post请求(get请求是获取数据,post请求是提交数据) Status Code:状态码(正常状态为200) Remote Address:端口IP地址 Response Headers 我们发送给服务器的,告诉服务器返回给我们的数据应该适配什么样的条原创 2021-08-01 17:49:29 · 524 阅读 · 3 评论 -
个人笔记本 | 网络爬虫 | 选择元素的方法
选择元素的方法CSS selectorXpath 右键检查的element板块下按Ctrl-F,可以输入css selector或xpath来定位元素 当然也要注意“所见非所得”和元素绝对位置改变的情况 CSS selector 根据Tag标签选择:Tag标签名 根据id选择:#id名 根据class选择:.class名 根据其他属性选择:[属性名] 或 [属性名=属性值] 在某元素的子元素中选择:父元素特征 > 子元素特征 (选择的是子元素,父元素是用来限制范围的) 在某元素原创 2021-08-01 18:37:32 · 217 阅读 · 0 评论 -
个人笔记本 | 网络爬虫 | requests爬虫
requests爬虫发起请求并获得数据解析数据 发起请求并获得数据 import requests url = 'https://www.baidu.com/' params = {'ie':'UTF-8','wd':'csdn'} headers = { 'Cookie':'BIDUPSID=CA523C6D6B9AB0AC1F9FDBB8E4740133; PSTM=1625711642; BAIDUID=919F7FA2111341750E74A98D2AA75663:FG=1; BD_UPN=12原创 2021-08-01 18:41:35 · 214 阅读 · 0 评论 -
个人笔记本 | 网络爬虫 | selenium自动化测试
selenium自动化测试有界面的自动化操作无界面的数据爬取 有界面的自动化操作 一般用于自动化登录打卡等操作 from selenium import webdriver driver = webdriver.Chrome('chromedriver.exe') # 初始化驱动器 driver.implicitly_wait(5) # 设置隐式等待时间为5秒 driver.maximize_window() # 最大化窗口 driver.get('https://xmuxg.xmu.edu.cn/log原创 2021-08-01 18:43:23 · 126 阅读 · 2 评论