- 博客(19)
- 收藏
- 关注
原创 selenium的注意事项,问题点记录
python默认UTF-8可以不写,但是我在测试一些网页时,发现缺省时中文会乱码,加上encoding=‘UTF-8’后中文就能正常显示了。chrome_obj.switch_to.frame(chrome_obj.find_element_by_...('frame对象')有些js渲染的数据在获取的页面内容里找不到,则需要通过find_elements或者元素,然后再解析这些元素的文本或者属性。如果规定时间内,没有执行完当前行代码,到了设置的时间,也会执行下一行代码。......
2022-08-31 20:04:15
406
1
原创 爬虫 零碎记录 xpath 注意事项 text()[x]可以取下标
4.re.findall(),xpath() ,strip()去首尾空格,replace()字符串替换等,各种函数返回的都是新的对象,原对象对函数的调用不会更改原对象的内容。特殊情况:当xpath()得到的元素中含有特殊字符(目前遇到的比如\n换行符)时,需要将该元素用str()将etree对象转化成字符串 后再处理。必须要将函数的调用赋值给一个变量(可以是新的变量,也可以是自身,但是都必须要赋值,然后再调用这个赋值过的变量。xpath中的//表示跨节点,/表示不跨节点,元素之间的过渡。
2022-08-22 20:11:08
573
原创 自己用python写的扫雷游戏 pygame 扫雷
1.鼠标左键点击,如果点击的格子是个空格(周围8个格子都没有雷),则需要再调用左键点击这8个格子,然后如果这8个格子里有某些格子也是空格,那就要继续调用点开该格子周围的8个格子,就是一个递归的思想了,边界就是点开的格子都不是空格,递归就结束了。我定义了一个二维列表list_block,这个数组一共有长*宽个元素,每个元素也是一个列表,这个列表里放了4个元素【格子的x坐标,格子的y坐标,格子是否是雷,格子当前的状态】(3) 同时满足上面两个条件的情况下,调用鼠标左击的函数点开该格子周围没有被标记的格子。...
2022-08-16 18:14:57
1542
原创 异步加载 XHR
这些得到的动态数据包,都存在于network-XHR里面。触发ajax异步加载后,XHR会多出来数据包,具体再分析。url没有发生改变,但是加载出来其他数据。如 鼠标的点击,鼠标的滑动等。
2022-08-08 14:32:21
186
原创 SSL报错 代理IP池
retry(stop_max_attempt_number=3) # 表示最大连接次数为3次。如果正常连接,response.text会返回代理IP地址信息 (不要用content返回)proxies字典中的键值-->协议://IP地址:端口号 冒号必须是英文状态下的冒号。在get或者post请求括号参数内添加字段timeout=XXX(XXX以秒为单位)proxies字典中的键名(协议头)-->需要跟请求的url协议头类型保持一致。retry是一个带参数的装饰器。...
2022-08-04 19:17:52
461
原创 爬虫 requests User-Agent池 FakeUserAgent URL传参
爬虫 requests User-Agent池 FakeUserAgent URL传参
2022-07-26 10:03:55
277
原创 pip更改国内服务器 解决下载龟速
1、在C\Users\[登录账户]\AppData\Roaming目录下创建文件夹pip。2、在pip文件夹下新建一个文本文档,输入下面的代码。(或者win+r输入%appdata%)然后另存为pip.ini。3、重新执行pip指令,速度很快。
2022-07-24 13:47:48
416
原创 python 猜数字游戏
随机生成1-100的一个数,给7次猜的机会猜对了或者7次都猜错了游戏结束,并弹出是否再来一次。每猜一次,给出提示High或者Low并给出下次再猜的数字范围。
2022-07-21 17:47:37
2775
1
原创 python 利用for循环遍历list列表删除元素时的报错 原理 及注意事项 IndexError: list index out of range
python 有关列表删除元素 for循环遍历 出错 原理 情况分析
2022-07-21 16:48:52
1728
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人