- 博客(56)
- 收藏
- 关注
原创 【Python】读取excel的不同工作簿的内容和获取工作簿的名称
使用pandas库读取Excel文件的不同工作簿(Sheet)并获取它们的名称,完成读取同一个excel, 不同的工作簿的内容
2024-08-28 16:21:08 586
原创 【python】关于判断空值None、判断len()=0,和 if not 的区别
python的“空”与“无”之辩,关于None,和空数值。在程序中,判断里面没有值和判断东西是不是为空,也是不一样的东西,我们可以往下看看具体的区别。
2024-08-28 16:14:15 7564
原创 【Python】函数内的全局变量关键字gobal值,在函数外调用,有块“免死金牌”
在编程中,global 关键字用于在函数内部声明变量为全局变量。这意味着该变量不是局部于函数的,而是可以在程序的任何地方访问和修改的。
2024-08-23 18:30:47 685
原创 【Python】selenium的find_element的By的方法是用不了了!!!?
最近,我发现selenium 的webdriver包最近改的有点看不懂了,原本的find_element(By.ID,“”),已经用不了了!不清楚为啥这个包会更新成这个样子
2024-08-23 15:30:29 325
原创 【Python】从文本提取含有地址信息的方法(省市县)
本文通过构建中国省份和城市以及各镇区的名称字段,梳理成json格式,省会城市以键对值的关系展示,
2024-08-15 10:54:05 516
原创 【Python】获取网页源码进行解码过程中,遇到“gbk”编码的问题
获取网页源码进行解码过程中,遇到“gbk”编码的问题,以及对gzip的了解
2024-08-15 10:50:08 633 1
原创 【Python】获取网页源码html后,存入SQL时html字段太长了怎么办?
我们在爬取网页内容时,往往会有几万个字段的html源码,如果存入MYSQL 上,会出现字段太大存入不了的问题。本文是分享解决这部分问题
2024-08-13 10:23:22 372
原创 【Python】解决“TypeError: __init__() got an unexpected keyword argument ‘XXX‘”的方法
Selenium Manager,可以解决chromedriver和Chrome 的 版本不一致的问题!
2024-08-09 15:31:50 1032
原创 【Python】requests获取网络响应的时候,遇到url超过最大重试次数的解决方法
解决“Maxretries exceeded with url”,url超过最大重试次数的方法
2024-08-07 17:13:59 563
原创 【Python】requests的response.text 和 urllib.request 的 response.read()的区别
两种获取网络响应方式的不同
2024-08-07 16:30:29 696
原创 【Python】bytes 和 bytearray 到底是什么类型呢?
bytes和bytearray同属于二进制序列类型,是常见的数值类型的一种。
2024-08-06 16:43:52 286
原创 遇到“NavigableString“object has no attribute “text“的解决方法(全)
解决beautifulsoup的解码的时候的问题
2024-07-29 17:12:45 390
原创 如何检查我的 Python 环境是否正确安装了某个模块?(以adb为例)
如果我们在cmd里已经安装好了某个包,但是要要检查 Python 环境里是否正确安装了某个模块,你可以按照以下的这些步骤操作。
2024-07-29 16:53:19 302
原创 【SQL】字段筛选出含有某些关键词,模糊匹配LIKE的用法
如果我们要查询数据库中,某个字段含有一些文字,例如查名字的时候,查询开头含有某些姓氏的人,或者查询以某些符号结尾的文字,都可以用模糊匹配来查询字段,WHERE子句+LIKE的操作符搜索。
2024-07-23 17:12:45 731
原创 【Python】dataframe两列的字符串和数字拼接,但出现none值则不做处理的方法(案例)
假设我们有一些公司的报价单,以Dataframe的格式来储存,它的字段有公司名、报价金额、和金额单位的信息。但不对空的部分拼接成新的一列。
2024-07-18 15:23:28 449
原创 【Python】Selenium怎么切换浏览器的页面
我们在爬网使用Selenium进行测试的时候,有时候想要点击浏览器里面的网址,跳到另一个页面上,获取第二个页面的内容。这里主要使用window_handles来切换浏览器的页面
2024-07-16 11:34:36 775
原创 【好用的工具】不用写代码就能爬虫的插件——Google Sheet的使用感受
最近看了个文章,谷歌的一款产品,直接用一个excel就可以干掉requests获取数据+存入表格的爬虫过程了,这让我学了那么久爬虫的我瑟瑟发抖。我查看它的说明文档,发现主要是部分网站的爬取已经打包好了,其中不乏亚马逊、雅虎、油管、沃尔玛等。在使用的过程中, 我觉得用的还是挺顺的!网络爬取的最大问题是稳定的网络访问连接问题,如果数据量太大,或者访问太频繁,就会有封号的危险。详细的做法,这里就不展示了,可以看上面的文章,我觉得它写的已经挺全的了。具体产品:Google Sheet,谷歌的“Excel”。
2024-07-15 14:51:06 364
原创 【Python】从Word文档中提取表格的方法
如果我们有一个文件夹,里面有很多的Word文件,然而我们如果要将word里面的表格一个个提取出来做分析,可以参考这个方法
2024-07-03 17:25:46 1472
原创 【Python】从文本字符串中提取数字、电话号码、日期、网址的方法汇总(全!)
我们做数据清洗的时候,遇到文本中提取出数字、电话号码、日期、网址等,可以参考这篇文章~
2024-07-03 16:09:19 1265
原创 【Python】使用Windows任务计划程序定时运行Python脚本!
在搭建了以后,如果我们想每天一次或者多次运行一个python 文件,推荐可以使用:Win的【任务计划程序】 +创建【批处理文件(.bat)】+运行Python脚本。
2024-07-02 14:43:22 2553
原创 【Python】在运行中使用warnings.filterwarnings,可以忽略测试中遇到的问题
如果我们正式运行的过程中,不想要警告报出,这时候可以通过 warnings.filterwarnings() 来设置过滤规则,决定哪些警告应该被显示或忽略。
2024-06-14 12:04:33 738
原创 【Python】selenium使用find_element时解决【NoSuchWindowException】问题的方法
NoSuchWindowException是 Selenium WebDriver 中的一种异常,当尝试切换到一个不存在的窗口时,或者在尝试获取窗口句柄时窗口已经关闭或不存在,就会抛出这个异常。以下是一些解决NoSuchWindowException的方法
2024-06-12 09:48:25 1526
原创 【Python】selenium 的EC.presence_of_element_located 和 EC.element_to_be_clickable 的区别
区分EC.element_to_be_clickable和EC.presence_of_element_located 和visibility_of_element_located
2024-06-07 19:06:52 1794
原创 【Python】Selenium WebDriver 中 `expected_conditions`(预期条件)模块
显式等待允许我们的自动化脚本等待某个条件成立,或者等待某个元素出现在页面上,直到达到超时时间
2024-06-07 18:18:10 897
原创 【Python】selenium使用find_element时解决【NoSuchElementException】问题的方法
NoSuchElementException是 Selenium WebDriver 中的一种异常,我们在写selenium.find_element 的时候也比较常见,它会在我们要尝试定位一个不存在的元素时抛出这类错误。
2024-06-07 17:18:41 793
原创 【Python】selenium使用find_element时解决【StaleElementReferenceException】问题的方法
StaleElementReferenceException是 Selenium WebDriver 中的一种异常,通常在元素与当前页面的状态不同步时抛出,比如页面已经刷新或导航到另一个页面,但是尝试操作的元素引用仍然是旧页面上的元素。
2024-06-07 12:03:17 723
原创 【Python】selenium 点击某个按钮 click() 出现的报错问题--ElementClickInterceptedException(全!)
ElementClickInterceptedException 是 Selenium WebDriver 中的一种异常,通常发生在尝试点击一个元素时,如果该元素被另一个元素遮挡,或者页面上有覆盖的元素(如弹出窗口、模态框、下拉菜单等),就会抛出这个异常。
2024-06-05 18:47:17 987
原创 【Python】统一安装多个包和特定版本号的方法
如果需要安装的包比较多,而且对依赖的包有版本号的要求,就可以使用以下这些方法,统一安装一个项目所需的所有依赖包。
2024-06-04 17:38:10 676
全国各行政区省市名称数据数据库Json格式+Python判断文本是否包含地区信息
2024-07-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人