Volcanoforever-CSDN博客

原创 ddddcorImportError: DLL load failed while importing onnxruntime_pybind11_state: 动态链接库(DLL)初始化例程失败

【摘要】针对ddddocr在Python3.12环境下失效的问题，提供两种解决方案：1）升级最新版ddddocr；2）修改源码中的图像缩放方法。具体操作为在__init__.py文件中，将Image.ANTIALIAS替换为Image.LANCZOS，或直接替换整行代码。该方法解决了因库未更新导致的兼容性问题，无需调整pillow或onnxruntime版本。

2025-08-26 13:30:15 347

原创使用 DrissionPage 批量抓取汽车之家车型及轮胎规格（含在售/停售）

本文介绍了一个使用DrissionPage爬取汽车之家车型数据的实战项目。项目目标是通过Python批量采集指定品牌的所有在售/停售车型及其轮胎规格参数，最终保存为Excel文件。文章详细讲解了环境配置、代码结构、核心采集流程，包括分页处理、车型详情页跳转、参数页数据提取等关键环节的实现方法。针对汽车之家这类JS动态渲染的复杂网站，项目采用DrissionPage无头浏览器解决方案，有效解决了传统爬虫工具难以处理动态内容的问题。文中还提供了实用建议和常见问题解决方法，适合有一定Python基础的开发者学习网

2025-08-02 11:44:48 873

原创 python使用RSA生成公钥以及加密解密方法

本文介绍了RSA加密算法的密钥生成及加解密实现。首先使用Crypto.PublicKey.RSA生成1024位的公钥和私钥，分别保存为.pem文件。加密过程包括：读取公钥构建对象，使用PKCS1_v1_5生成加密器，对数据进行加密后用base64编码。解密过程则相反：base64解码后读取私钥构建对象，使用PKCS1_v1_5生成解密器进行解密。代码示例展示了完整的加密（"alexisastupiddonkey!"）和解密流程，涉及Crypto库的RSA、PKCS1_v1_5模块以及ba

2025-06-29 20:34:48 468

原创 scrapy-Error: [Failure instance: Traceback (failure with no frames): ＜class ‘scrapy.pipelines.files.

Scrapy爬虫报错分析：FileException错误通常因域名未限制导致文件传输失败，需在allowed_domains中正确设置目标域名（如["www.xxx.com"]）来限制爬取范围。此错误提示开发者检查域名配置是否完善，避免因未过滤无关域名引发文件处理异常。

2025-06-10 16:44:22 277 2

原创 This probably means that Tcl wasn‘t installed properly.

在Python中使用Tkinter时，若遇到“Tcl未正确安装”的错误，可以通过以下步骤解决：首先，通过import tkinter as tk; print(tk.__file__)找到Tkinter的安装路径，并定位到tcl文件夹。接着，将tcl8.6和tk8.6文件夹的路径添加到系统的环境变量Path中。最后，将这两个文件夹复制到Python的Lib目录下。这些步骤有助于确保Tcl和Tkinter正确配置，从而解决运行问题。

2025-05-17 21:50:00 367

原创取自（GitHub）大佬分享--正则表达式使用和练习

正则表达式是一组由字母和符号组成的特殊文本，它可以用来从文本中找出满足你想要的格式的句子。一个正则表达式是一种从左到右匹配主体字符串的模式。“Regular expression”这个词比较拗口，我们常使用缩写的术语“regex”或“regexp”。正则表达式可以从一个基础字符串中根据一定的匹配模式替换文本中的字符串、验证表单、提取字符串等等。想象你正在写一个应用，然后你想设定一个用户命名的规则，让用户名包含字符、数字、下划线和连字符，以及限制字符的个数，好让名字看起来没那么丑。

2024-07-30 00:43:04 1041

原创 python使用beautifulsoup爬取起点小说的名称，作者，摘要，更新信息

方法写入CSV文件的表头行，表头包含了小说的信息字段，即'小说名称', '作者', '摘要', '更新信息'。总之，这段代码的作用是从指定网页中提取小说的信息，并将这些信息存储在一个CSV文件中，以便进一步处理或分析。打开一个CSV文件（如果文件不存在，将创建一个新的），设置文件的编码为UTF-8，并创建一个CSV写入器。这段代码是用Python编写的，目的是从指定网页中抓取小说信息，下面有代码。方法将提取的小说信息写入CSV文件的一行。中的每一个小说条目，然后使用。最后，使用CSV写入器的。

2023-09-22 10:30:41 1152

原创使用Python和BeautifulSoup爬取酷狗网页排行榜数据并保存为CSV文件

这段代码的主要功能是从指定网页中提取歌曲的名称和链接，并将这些数据保存到CSV文件中。这个CSV文件可以用于进一步的数据分析或处理。向指定的URL发送HTTP GET请求，获取网页的内容，并将其存储在变量。最后，打印一条成功消息，指示链接已保存到CSV文件中。方法查找每个歌曲的名称和链接，然后将它们添加到。定义CSV文件的列名为 ["歌曲", "链接"]。元素，这样就找到了排行榜中的歌曲列表。将歌曲的名称和链接数据写入CSV文件。变量中的网页内容，以便后续操作。用于处理CSV文件。，用于存储歌曲的链接。

2023-09-22 10:25:23 1193

原创大数据-zookeeper显示进程被占用，但是jps并没有显示QuorumPeerMain进程

这种情况是因为在使用完zookeeper之后，没有关闭好zookeeper，导致zookeeper的唯一标识id发生了改变，我们查看在zookeeper/conf/zoo.cfg里面的文件，可以发现我们刚开始绑定的时候。进入到 /home/hadoop/data/zookeeper/zkdata里面，你会发现myid里面的内容发生了改变。在zookeeper配置好，并使用脚本启动zookeeper之后，查看zookeeper的进程时候，出现。这个时候就需要将每个虚拟机的唯一标识更正过来既可。

2023-09-20 15:34:06 1122 1

原创学100种基本爬虫项目--使用正则表达式来获取整篇小说

我们的目标是从"bbiquge"网站上获取某本小说的全文内容，并保存为.txt文件。我们将使用requests库进行网络请求，使用re和parsel库来解析页面，并把小说内容保存到本地。：对每一个提取到的章节链接，发送GET请求获取章节页面的HTML，然后解析HTML以提取章节标题和内容。最后，将提取到的标题和内容写入到本地的txt文件。最后，打开（如果不存在则创建）一个txt文件，并以追加的模式将标题和内容写入文件。在这段代码中，首先是拼接出每个章节的URL（），以及发送HTTP请求时使用的请求头（

2023-07-15 12:44:20 1516 1

原创学100种基本爬虫项目--模拟浏览器发送请求并解析数据之爬取单章小说内容

本文将介绍如何使用Python中的requests模块发送请求，并使用解析库解析返回的数据。同时，我们还将了解到在数据解析过程中使用CSS选择器和XPath的情况，以及在无法获取标签时使用正则表达式的情况。举个例子，假设我们想要提取文章的标题，可以使用CSS选择器或XPath进行定位和提取。库解析了获取到的HTML文本，并通过CSS选择器定位到标题所在的h1标签，然后使用。另外，我们还可以通过CSS选择器或XPath来提取其他标签中的数据。接下来，我们可以将提取到的数据保存到本地文件中。

2023-07-14 21:28:04 842 1

原创【尚硅谷】SSM框架全套教程-报错集-mybatis中动态拼接SQL出现java.lang.NumberFormatException异常，数据类型不匹配引起的。

可能是在执行查询之前的参数处理或SQL语句构建过程中，将参数错误地用作了数字类型的条件，而实际上参数应该是字符串类型。通过仔细检查和调试相关的代码，特别是涉及到参数和SQL查询的部分，您应该能够找到导致此异常的具体原因并进行修复。要解决这个问题，您需要检查涉及到参数的地方，确保参数的数据类型与SQL语句中的占位符匹配。如果参数是从用户输入获取的，确保对用户输入进行适当的验证和转换，以防止非法输入导致的异常。检查查询语句中的条件语句，确保使用字符串类型的参数作为字符串比较，而不是误用为数字类型。

2023-06-09 11:35:32 430 1

Volcano99的博客