mysql 导入 xc2 xa0_解析 - Python：从字符串中删除\ xa0？

最新推荐文章于 2023-02-27 14:35:05 发布

直推小新

最新推荐文章于 2023-02-27 14:35:05 发布

阅读量337

点赞数

文章标签： mysql 导入 xc2 xa0

本文链接：https://blog.csdn.net/weixin_30205153/article/details/114333771

版权

在尝试了几种方法之后，总结一下，这就是我的方法。以下是从解析的HTML字符串中避免/删除\ xa0字符的两种方法。

假设我们的原始html如下：

raw_html = '

Dear Parent,

This is a test message, kindly ignore it.

Thanks

所以让我们尝试清理这个HTML字符串：

from bs4 import BeautifulSoup

raw_html = '

Dear Parent,

This is a test message, kindly ignore it.

Thanks

text_string = BeautifulSoup(raw_html, "lxml").text

print text_string

#u'Dear Parent,\xa0This is a test message,\xa0kindly ignore it.\xa0Thanks'

上面的代码在字符串中生成这些字符\ xa0。要正确删除它们，我们可以使用两种方法。

方法＃1(推荐)：第一个是BeautifulSoup的get_text方法，strip参数为True所以我们的代码变成：

clean_text = BeautifulSoup(raw_html, "lxml").get_text(strip=True)

print clean_text

# Dear Parent,This is a test message,kindly ignore it.Thanks

方法＃2：另一种选择是使用python的库unicodedata

import unicodedata

text_string = BeautifulSoup(raw_html, "lxml").text

clean_text = unicodedata.normalize("NFKD",text_string)

print clean_text

# u'Dear Parent,This is a test message,kindly ignore it.Thanks'

我还在这个博客上详细介绍了这些方法，您可能需要参考这些方法。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

直推小新

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

《Python基础教程》内容总览篇（持续更新中）

weixin_43178406的博客

08-26

20万+

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。个人精心开设的《Python基础课程》专栏订阅量接近900，帮助不少同学解决了Bug。

python rarfile不支持中文路径_python使用zipfile解压文件中文乱码问题

weixin_36255893的博客

01-12

9912

中文在编程中真实后娘养的，各种坑爹，python3下中文乱码这个问题抓破了头皮，头疼。看了alex的文章，才有种恍然大悟的感觉(链接在底部)。一句话，就是转换成unicode，压缩前是什么编码，使用什么编码encode再decode回来先看测试代码：#-*- coding: utf-8 -*-import zipfile# 默认模式r,读azip = zipfile.ZipFile("/Users...

参与评论您还未登录，请先登录后发表或查看评论

Python 字符串处理特殊空格\xc2\xa0\t\n Non-breaking space

12-20

今天遇到一个问题，使用python的find函数寻找字符串中的第一个空格时没有找到正确的位置，例如： http://zc.whmc.edu.cn ==> 无法访问的网站或无效的招标网站使用find(” “)函数寻找时找到的第一个空格对应在==>后面的那个位置。一开始觉得是编码问题，但是文件是用UTF-8编码的，按理说不应该产生编码问题，就用Sublime打开一看是这样的：可以看到，我的Sublime设置了显示空白，所以第二个红线上方有一个白点，而第一个红线上方却没有，这说明第一个红线上方那个字符确实不是一个空格，也就是说函数的运行没有问题。但那个空格倒底是个什么东西呢？在Sublime中

去除特殊空格：\xc2\xa0

u013347671的博客

12-21

7991

在去除空格的时候遇到一种情况： a = '2 ' b = '3' print a.split(),b 输出结果： ['2\xc2\xa0'] 3 在网上可以查到，==>对应的UTF-8编码是\x3d\x3d\x3e，所以前面的那个神秘字符的编码就是\xc2\xa0，上网查到这是一个叫做Non-breaking space的东西，用于阻止在此处自动换行和阻止多个空格被压缩成一个。至...

mysql 导入 xc2 xa0_MySql 插入数据库报错 Incorrect string value: '\xF0\xA0\x86\xA2'

weixin_39752800的博客

02-03

322

今天从nginx日志分析搜索关键字，然后把关键字插入到Mysql数据库里，出现如下错误SQL state [HY000]; error code [1366]; Incorrect string value: '\xF0\xA0\x86\xA2' for column 'XXXX' at row 38; nested exception is java.sql.SQLException: Inco...

mysql 导入 xc2 xa0_Python 字符串处理特殊空格xc2xa0tn Non-breaking space

weixin_35406812的博客

02-18

243

今天遇到一个问题，使用python的find函数寻找字符串中的第一个空格时没有找到正确的位置，例如：http://zc.whmc.edu.cn ==> 无法访问的网站或无效的招标网站使用find(" ")函数寻找时找到的第一个空格对应在==>后面的那个位置。一开始觉得是编码问题，但是文件是用UTF-8编码的，按理说不应该产生编码问题，就用Sublime打开一看是这样的：可以看到，我的S...

Python 字符串处理特殊空格 \xc2\xa0 Non-breaking space

最新发布

12-22

可以使用Python的`encode()`方法将字符串转换为指定编码格式的字节串，然后再插入到数据库中。以上是解决 "Incorrect string value" 错误的几种常见方法，根据具体情况选择适合的方法进行处理。

python中文转化gb2321_Python3中使用Requests和BeaitfulSoup的编码问题

weixin_39971138的博客

12-21

319

写在前面的话：学习Python有一段时间了，但是一直没有太多的实战，前期的学习主要是看买的电子书 Python学习手册 (额，刚刚看了一下，这边书的电子书居然已?下架，但是我基本确定我买的就是这个，电子书和实体的特点一样：几乎都是同类书中最贵的，当时真的是买的很心痛啊！)，看了不到30%，发现这本说还是有点门槛的，于是就看了一些了零基础的视频，还有比较经典的廖雪峰的Python3教程, 还有对应的...

解决\xc2\xa0是什么

dqchouyang的专栏

01-05

1212

xc2\xa0

[MySQL] 解决办法：MySQL Workbench 8.0 CE UnicodeEncodeError: ‘cp950‘ codec can‘t encode character ‘\xa0‘

我在山城重庆，我希望能为这片软件沙漠地带贡献自己的一滴水，Stay tuned!

10-25

1837

功能（右键点击表名，导出表数据），直接查出来所有数据，之后使用结果中的导出，再导出即可。有人说更改字符集之类的，开始我也是这么想办法，后来放弃。最终的解决方式是，不使用。由于文件windows默认和文件输出的数据编码不一致造成错误。：本文原创由 bluetata。解决办法：（针对导出）解决办法：（针对导入）、转载请务必注明出处。

python处理 \xc2\xa0

csdncheng123的博客

03-07

3852

最近使用python3处理文本时使用去空格的方式始终发现没有处理干净，以下是处理步骤，特此记录一下； 1、编码猜想按utf-8的方式编码，转成bytes，并查看 b = a.encode(encoding='utf-8') print(b)（python3表示方法）显示b' \xc2\xa0 xxxxx' 2、查找\xc2\xa0相关内容 \xc2\xa0：是一个叫做Non-b...

mysql替代符号_如何替换mysql数据库中 A字段中符号啊

weixin_36146811的博客

01-18

867

如何替换mysql数据库中 A字段中 \,.这样的英文标点符号回复讨论(解决方案)update table set A = replace(A,'\\,.','你要替换的值') where ...where 后面的省略号是什么意思。我之前update table set A = replace(A,'\','')这样写的就替换不掉。这样才行update table set A = replac...

【工程实践】python 去除\xa0、\u3000、\n、\u2800、\t等字符

Dong_ZH的博客

02-27

1万+

空格可以分为两类，一类为普通文本空格，另一类为html实体空格。普通文本空格介绍普通半角空格和普通全角空格。html实体空格介绍三种，分别为html实体不间断空格（）、html实体半角空格( )和html实体全角空格( )。

MySQL插入Incorrect string value: ‘\xF3\xA0\x84\x80‘

NullToSay的踩坑日常

07-23

1493

一、情况：数据库现有格式是utf8，插入一个特殊字符报错。二、原因：这是因为mysql的UTF-8只支持三个字节的存储，但是此处特殊字符'\xF3\xA0\x84\x80'占了4个字节。三、方法：将存储特殊字符的字段的编码修改为utf8mb4，支持存储4字节的数据。 ...

给mysql表，加上自动时间戳，以及解决"Incorrect string value: '\\xF0\\x9F\\x93\\x9D\\xC2\\xA0...' for column 'con的错误

replat-xin

10-24

1649

创建表时CURRENT_TIMESTAMP，一定要设置默认的值 "Incorrect string value: '\\xF0\\x9F\\x93\\x9D\\xC2\\xA0...' for column 'con 报错是因为utf8不能容纳超过3个字节的emoji表情，需要使用utf8mb4字符集一定要注释掉原来代码中的charset 让自增的字段重新开始计数 t...

mysql 反斜杠转义_python-字符串带反斜杠写进数据库

05-26

好的，关于 MySQL 中的反斜杠转义和 Python 中字符串带反斜杠写进数据库的问题，我可以为您解答。在 MySQL 中，反斜杠是用来转义特殊字符的。如果您要将带有反斜杠的字符串写入数据库，需要将反斜杠进行转义。例如，要将字符串 "C:\Program Files\" 写入数据库，需要将反斜杠转义成双反斜杠，即 "C:\\Program Files\\"。在 Python 中，字符串也可以使用反斜杠进行转义，例如可以使用 "\n" 表示换行符。如果要将带有反斜杠的字符串写入数据库，需要将反斜杠进行转义。一种常见的方式是使用 Python 中的原始字符串（raw string），即在字符串前面加上一个字母 r。例如，要将字符串 "C:\Program Files\" 写入数据库，可以使用原始字符串 r"C:\Program Files\"。总之，无论是在 MySQL 中还是在 Python 中，要注意反斜杠的转义问题，以避免出现意外的错误。