自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(56)
  • 收藏
  • 关注

原创 【Python】列表统计数值的汇总方法(包括频数、占比计算、绝对值计算等)

多种常见的列表数据的统计方法的汇总

2024-09-04 16:01:04 526

原创 【SQL】删除表中重复数据的方法

用id选出不重复的数据

2024-09-04 15:53:13 505

原创 【Python】读取excel的不同工作簿的内容和获取工作簿的名称

使用pandas库读取Excel文件的不同工作簿(Sheet)并获取它们的名称,完成读取同一个excel, 不同的工作簿的内容

2024-08-28 16:21:08 586

原创 【python】关于判断空值None、判断len()=0,和 if not 的区别

python的“空”与“无”之辩,关于None,和空数值。在程序中,判断里面没有值和判断东西是不是为空,也是不一样的东西,我们可以往下看看具体的区别。

2024-08-28 16:14:15 7564

原创 【Python】函数内的全局变量关键字gobal值,在函数外调用,有块“免死金牌”

在编程中,global 关键字用于在函数内部声明变量为全局变量。这意味着该变量不是局部于函数的,而是可以在程序的任何地方访问和修改的。

2024-08-23 18:30:47 685

原创 【Python】selenium的find_element的By的方法是用不了了!!!?

最近,我发现selenium 的webdriver包最近改的有点看不懂了,原本的find_element(By.ID,“”),已经用不了了!不清楚为啥这个包会更新成这个样子

2024-08-23 15:30:29 325

原创 【Python】从文本提取含有地址信息的方法(省市县)

本文通过构建中国省份和城市以及各镇区的名称字段,梳理成json格式,省会城市以键对值的关系展示,

2024-08-15 10:54:05 516

原创 【Python】获取网页源码进行解码过程中,遇到“gbk”编码的问题

获取网页源码进行解码过程中,遇到“gbk”编码的问题,以及对gzip的了解

2024-08-15 10:50:08 633 1

原创 【Python】获取网页源码html后,存入SQL时html字段太长了怎么办?

我们在爬取网页内容时,往往会有几万个字段的html源码,如果存入MYSQL 上,会出现字段太大存入不了的问题。本文是分享解决这部分问题

2024-08-13 10:23:22 372

原创 【Python】连接数据库的操作整理(打包成函数)

整理了一些处理数据库时会用到的语句!

2024-08-13 10:21:28 131

原创 【Python】解决“TypeError: __init__() got an unexpected keyword argument ‘XXX‘”的方法

Selenium Manager,可以解决chromedriver和Chrome 的 版本不一致的问题!

2024-08-09 15:31:50 1032

原创 【Python】requests获取网络响应的时候,遇到url超过最大重试次数的解决方法

解决“Maxretries exceeded with url”,url超过最大重试次数的方法

2024-08-07 17:13:59 563

原创 【Python】requests的response.text 和 urllib.request 的 response.read()的区别

两种获取网络响应方式的不同

2024-08-07 16:30:29 696

原创 【Python】 判断它是什么数据类型的方法?(常用方法汇总)

判断类型的方法

2024-08-06 16:49:39 558

原创 【Python】bytes 和 bytearray 到底是什么类型呢?

bytes和bytearray同属于二进制序列类型,是常见的数值类型的一种。

2024-08-06 16:43:52 286

原创 遇到“NavigableString“object has no attribute “text“的解决方法(全)

解决beautifulsoup的解码的时候的问题

2024-07-29 17:12:45 390

原创 如何检查我的 Python 环境是否正确安装了某个模块?(以adb为例)

如果我们在cmd里已经安装好了某个包,但是要要检查 Python 环境里是否正确安装了某个模块,你可以按照以下的这些步骤操作。

2024-07-29 16:53:19 302

原创 【SQL】字段筛选出含有某些关键词,模糊匹配LIKE的用法

如果我们要查询数据库中,某个字段含有一些文字,例如查名字的时候,查询开头含有某些姓氏的人,或者查询以某些符号结尾的文字,都可以用模糊匹配来查询字段,WHERE子句+LIKE的操作符搜索。

2024-07-23 17:12:45 731

原创 【Python】使用抓包Fiddler软件,网络查询 遇到“您的连接不是私密连接”的问题的解决方法

解决您的连接不是私密连接的问题

2024-07-23 16:24:27 263

原创 【Python】dataframe两列的字符串和数字拼接,但出现none值则不做处理的方法(案例)

假设我们有一些公司的报价单,以Dataframe的格式来储存,它的字段有公司名、报价金额、和金额单位的信息。但不对空的部分拼接成新的一列。

2024-07-18 15:23:28 449

原创 【Python】dataframe 两列的数值合并计算,但是如果是none值,则视为0相加减

dataframe的列合并处理问题

2024-07-18 10:16:50 546

原创 【Python】文件夹解压的方法汇总

在Python中,批量读取文件和对文件夹进行操作是常见的任务,我们可以通过标准库中的os来实现。

2024-07-16 17:00:13 571

原创 【Python】Selenium怎么切换浏览器的页面

我们在爬网使用Selenium进行测试的时候,有时候想要点击浏览器里面的网址,跳到另一个页面上,获取第二个页面的内容。这里主要使用window_handles来切换浏览器的页面

2024-07-16 11:34:36 775

原创 【好用的工具】不用写代码就能爬虫的插件——Google Sheet的使用感受

最近看了个文章,谷歌的一款产品,直接用一个excel就可以干掉requests获取数据+存入表格的爬虫过程了,这让我学了那么久爬虫的我瑟瑟发抖。我查看它的说明文档,发现主要是部分网站的爬取已经打包好了,其中不乏亚马逊、雅虎、油管、沃尔玛等。在使用的过程中, 我觉得用的还是挺顺的!网络爬取的最大问题是稳定的网络访问连接问题,如果数据量太大,或者访问太频繁,就会有封号的危险。详细的做法,这里就不展示了,可以看上面的文章,我觉得它写的已经挺全的了。具体产品:Google Sheet,谷歌的“Excel”。

2024-07-15 14:51:06 364

原创 【SQL】做项目时用到的语句整理(去重/多表关联)

sql 的一些去重和多表关联语句的整理

2024-07-09 16:17:19 902

原创 【Python】从Word文档中提取表格的方法

如果我们有一个文件夹,里面有很多的Word文件,然而我们如果要将word里面的表格一个个提取出来做分析,可以参考这个方法

2024-07-03 17:25:46 1472

原创 【Python】从文本字符串中提取数字、电话号码、日期、网址的方法汇总(全!)

我们做数据清洗的时候,遇到文本中提取出数字、电话号码、日期、网址等,可以参考这篇文章~

2024-07-03 16:09:19 1265

原创 【Python】使用Windows任务计划程序定时运行Python脚本!

在搭建了以后,如果我们想每天一次或者多次运行一个python 文件,推荐可以使用:Win的【任务计划程序】 +创建【批处理文件(.bat)】+运行Python脚本。

2024-07-02 14:43:22 2553

原创 【Python】随机数汇总(全!!!)

​我们写python代码的时候,很少能用得上随机数,但是随机数有很多妙用。

2024-06-20 18:09:36 1726

原创 数据库、中台、报表平台之间的关系

我最近在接触【报表平台】和【中台】,在理清他们的关系以后,简单写一个入门级的区分。

2024-06-18 12:08:55 1445

原创 【Python】在运行中使用warnings.filterwarnings,可以忽略测试中遇到的问题

如果我们正式运行的过程中,不想要警告报出,这时候可以通过 warnings.filterwarnings() 来设置过滤规则,决定哪些警告应该被显示或忽略。

2024-06-14 12:04:33 738

原创 【Python】selenium使用find_element时解决【NoSuchWindowException】问题的方法

NoSuchWindowException是 Selenium WebDriver 中的一种异常,当尝试切换到一个不存在的窗口时,或者在尝试获取窗口句柄时窗口已经关闭或不存在,就会抛出这个异常。以下是一些解决NoSuchWindowException的方法

2024-06-12 09:48:25 1526

原创 打工人让自己看起来很“卷”的一些办公技巧(建议收藏!)

一些有意思的办公技巧的推荐!

2024-06-11 17:16:57 979

原创 【Python】selenium 的EC.presence_of_element_located 和 EC.element_to_be_clickable 的区别

区分EC.element_to_be_clickable和EC.presence_of_element_located 和visibility_of_element_located

2024-06-07 19:06:52 1794

原创 【Python】Selenium WebDriver 中 `expected_conditions`(预期条件)模块

显式等待允许我们的自动化脚本等待某个条件成立,或者等待某个元素出现在页面上,直到达到超时时间

2024-06-07 18:18:10 897

原创 【Python】selenium使用find_element时解决【NoSuchElementException】问题的方法

NoSuchElementException是 Selenium WebDriver 中的一种异常,我们在写selenium.find_element 的时候也比较常见,它会在我们要尝试定位一个不存在的元素时抛出这类错误。

2024-06-07 17:18:41 793

原创 【Python】selenium使用find_element时解决【StaleElementReferenceException】问题的方法

StaleElementReferenceException是 Selenium WebDriver 中的一种异常,通常在元素与当前页面的状态不同步时抛出,比如页面已经刷新或导航到另一个页面,但是尝试操作的元素引用仍然是旧页面上的元素。

2024-06-07 12:03:17 723

原创 【Python】selenium的异常类selenium.common.exceptions的汇总

关于Exception 的各种错误的汇集

2024-06-06 18:12:55 746

原创 【Python】selenium 点击某个按钮 click() 出现的报错问题--ElementClickInterceptedException(全!)

ElementClickInterceptedException 是 Selenium WebDriver 中的一种异常,通常发生在尝试点击一个元素时,如果该元素被另一个元素遮挡,或者页面上有覆盖的元素(如弹出窗口、模态框、下拉菜单等),就会抛出这个异常。

2024-06-05 18:47:17 987

原创 【Python】统一安装多个包和特定版本号的方法

如果需要安装的包比较多,而且对依赖的包有版本号的要求,就可以使用以下这些方法,统一安装一个项目所需的所有依赖包。

2024-06-04 17:38:10 676

Pythonselenium的find-element的By的方法是用不了了???

旧版的webdriver包

2024-08-20

全国各行政区省市名称数据数据库Json格式+Python判断文本是否包含地区信息

内容概要: 通过构建中国省份和城市以及各镇区的名称字段,梳理成json格式储存,省会城市以键对值的关系保存。 除了json格式储存的省市地区镇区的名称字段,还附带所有省会、城市、地区/镇区的列表,以及Python判断文字标题中是否含有省市地址信息的代码。 数据量:所有的城市和镇区等字段共3285条!内容共包含国内34个省级行政单位,包括23个省,5个自治区,4个直辖市和2个特别行政区。 能获得什么:【全国各行政区省市名称字段Json】 + 【所有省会、城市、地区/镇区的列表 】+ 【判断文字标题中 + 含有国内各省市地区名称信息的Python代码】。

2024-07-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除