Python
文章平均质量分 56
Python
码道功成
自我感觉有点笨,总是嫌大牛们写的东西不够详细,所以本人写的博客会尽量通俗易懂~
展开
-
pandas中loc、iloc、at、iat的区别
废话不多说,直接上代码。原创 2024-04-25 15:47:16 · 159 阅读 · 1 评论 -
使用进程池处理数据
那如果需传递其它额外参数,那就得使用partial(偏函数)将处理单个进程作业的函数与参数包起来,示例中就是 func = partial(test_process, len(arr)) 这一行,函数名要放在第一个,后面依次按需放多个参数。那就使用数组呗,将df转为字典数组,其中test_process为处理单个进程作业的函数,param1, param2,param3分别为额外的传参;其中param1, param2,param3分别对应上面的传参,line对应的当前行的数据。2、进程池传递多个参数。原创 2024-03-01 15:51:36 · 369 阅读 · 0 评论 -
Linux环境下运行selenium4.14
2) 根据谷歌浏览器版本下载对应的浏览器驱动版本。(这个页面里是高版本的驱动)1)运行下面命令查看浏览器版本。(这个页面是低版本的驱动)原创 2023-10-31 16:41:56 · 892 阅读 · 0 评论 -
python爬虫报错:This version of ChromeDriver only supports Chrome version 114
它是一个开源的Java库,以完全自动化的方式执行Selenium WebDriver所需的驱动程序的管理(即下载、设置和维护)。其最新版本提供了其他相关功能,如发现本地系统中安装的浏览器的能力,无缝运行Docker容器中的浏览器,以及监控能力,废话不多说,直接上代码。然后,使用浏览器版本,它试图通过各种方法找到合适的驱动程序版本。修改Python代码,添加executable_path参数,指定浏览器驱动路径。这里下载浏览器对应的驱动,可是我的浏览器是117版本的,这里面根本找不到。2)换浏览器驱动版本;原创 2023-10-30 14:58:26 · 1542 阅读 · 0 评论 -
pandas使用笔记
【代码】pandas使用笔记。原创 2023-09-27 14:15:21 · 96 阅读 · 0 评论 -
Python反爬取访问验证处理
这种验证方式没找到绕过去的方法,那就只能用最笨的办法,弹出验证框后,将等待时间延长,然后手动点击验证。原创 2023-07-07 15:02:04 · 839 阅读 · 0 评论 -
Python常用方法
out_path:输出文件路径;datas:字典数组;mode:追加(a)或者覆盖(w)#如果在Python2.x下添加了上面的配置还出现中文乱码,则加以下配置。# 将 jsonl 数据写入文件。在.py文件头部添加这行代码。原创 2023-06-20 14:48:21 · 208 阅读 · 0 评论 -
Python操作mysql
此处有个坑,就是字符串的格式化 s%必须用括号括起来, 我最初是这样写的:sql = "update gpt_exams_test set question_desc_distinct='%s',question_desc_text='%s' where question_id=%s",结果一直报SQL语法错误。使用pandas的优点是返回的结果是DataFrame,我们可以基于DataFrame取数更方便。单条插入和单条更新其实是一样的,只不过传入的SQL不同而已。# 使用with指定文件编码。原创 2023-06-20 14:42:12 · 423 阅读 · 0 评论