已解决Unclosed quotation mark after the character string

已解决(Python将爬虫抓取到的网页源码写入数据库报错)Unclosed quotation mark after the character string











报错代码



粉丝群里面的一个小伙伴想用Python将爬虫抓取到的网页源码写入数据库,但是发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错信息如下:


在这里插入图片描述




报错翻译



报错信息翻译

字符串后未关闭的引号





报错原因



报错原因

Python爬虫将网页源码写入数据库的时候,通常遇到这个错是因为 sql 字符串中少了一个单引号的原因,但是还有一个类特别隐蔽的问题:sql的值中的字符串里边带有 \x00 和 \u0000的截止符。这类符号会导致 pymssql 处理不到后边的单引号。




解决方法



解决方法是去掉这类的字符即可:

try:
    html_str = html_str.replace('\u0000', '').replace('\x00', '')
except Exception:
    html_str = html_str 

以上是此问题报错原因的解决方法,欢迎评论区留言讨论是否能解决,如果有用欢迎点赞收藏文章谢谢支持,博主才有动力持续记录遇到的问题!!!

千人全栈VIP答疑群联系博主帮忙解决报错

由于博主时间精力有限,每天私信人数太多,没办法每个粉丝都及时回复,所以优先回复VIP粉丝,可以通过订阅限时9.9付费专栏《100天精通Python从入门到就业》进入千人全栈VIP答疑群,获得优先解答机会(代码指导、远程服务),白嫖80G学习资料大礼包,专栏订阅地址:https://blog.csdn.net/yuan2019035055/category_11466020.html

  • 优点作者优先解答机会(代码指导、远程服务),群里大佬众多可以抱团取暖(大厂内推机会),此专栏文章是专门针对零基础和需要进阶提升的同学所准备的一套完整教学,从0到100的不断进阶深入,后续还有实战项目,轻松应对面试!

  • 专栏福利简历指导、招聘内推、每周送实体书、80G全栈学习视频、300本IT电子书:Python、Java、前端、大数据、数据库、算法、爬虫、数据分析、机器学习、面试题库等等

  • 注意:如果希望得到及时回复,订阅专栏后私信博主进千人VIP答疑群在这里插入图片描述
    在这里插入图片描述

免费资料获取,更多粉丝福利,关注下方公众号获取

在这里插入图片描述

### 正则表达式中未闭合字符类的解决方案 在正则表达式中,`unclosed character class` 的错误通常是因为方括号 `[ ]` 没有正确配对造成的。例如,在定义一个字符类时,如果忘记关闭右方括号 `]`,就会触发该错误。 以下是几种可能的原因以及对应的解决方法: #### 原因一:缺少右方括号 如果在一个正则表达式的字符类部分忘记了添加右方括号,则会引发此错误。例如: ```regex [a-z ``` 这种情况下,应该补充缺失的右方括号以完成字符类的定义[^1]: ```regex [a-z] ``` #### 原因二:嵌套不匹配 当尝试在字符类内部使用转义符 `\` 或其他特殊字符时,可能会意外地破坏方括号的平衡。例如: ```regex [\]] ``` 上述例子试图匹配一个单独的右方括号,但由于语法解析顺序问题可能导致报错。可以改为如下形式来避免歧义[^2]: ```regex [\\]] ``` #### 原因三:字符串初始化中的潜在问题 虽然这并非直接与正则表达式有关,但在某些编程环境中(如 C/C++),字符串常量被用来初始化数组时可能出现截断零终止符的情况。尽管这不是严格意义上的正则表达式错误,但它提醒开发者注意数据结构的一致性和完整性检查[^3]。 为了验证并修正这些问题,建议采用以下策略之一或组合使用它们: - **仔细审查模式串**:逐字核对你编写的正则表达式是否存在遗漏或者多余符号。 - **利用调试工具**:许多现代 IDE 和在线服务提供专门针对正则表达式的测试功能,可以帮助快速定位具体位置上的缺陷。 下面给出一段 Python 中处理简单情况的例子作为示范: ```python import re pattern = r"[a-zA-Z0-9]" # 定义合法的字母数字范围内的字符集 test_string = "hello world_123" result = re.findall(pattern, test_string) print(result) # 输出符合规则的部分 ['h', 'e', 'l', 'l', 'o', 'w', 'o', 'r', 'l', 'd', '_', '1', '2', '3'] ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

袁袁袁袁满

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值