python基础之将中文标点符号转为英文标点符号

最新推荐文章于 2024-06-21 14:41:09 发布

Xahoo！

最新推荐文章于 2024-06-21 14:41:09 发布

阅读量7.9k

点赞数 5

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/owen_goodman/article/details/107783304

版权

Python 专栏收录该内容

35 篇文章 3 订阅

订阅专栏

方法一：

对于有明确需求的转换，使用translate要更简单一些，它不需要你说的正则表达式，代码如下：

# In Python3, use str.maketrans instead（皆可）
# table里对应写出你需要转换成的转台 比如：（）==> ()
table = {ord(f):ord(t) for f,t in zip(
     u'，。！？【】（）％＃＠＆１２３４５６７８９０',
     u',.!?[]()%#@&1234567890')}

# 需要转换的文本
t = u'中国，中文，标点符号！你好？１２３４５＠＃【】+=-（）'

t2 = t.translate(table)

'''
print(t2)
中国,中文,标点符号!你好?12345@#[]+=-()
'''

方法二：

import unicodedata

t = u'中国，中文，标点符号！你好？１２３４５＠＃【】+=-（）'

t2 = unicodedata.normalize('NFKC', t)

'''
print t2
中国,中文,标点符号!你好?12345@#【】+=-()
'''

unicode有个normalize的过程，按照unicode标准，有C、D、KC、KD四种，KC会将大部分的中文标点符号转化为对应的英文，还会将全角字符转化为相应的半角字符。

转载请注明转自：https://blog.csdn.net/Owen_goodman/article/details/107783304

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Xahoo！

关注关注

5
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python ：中英文文本预处理（包含去标点分词词干提取）

海军上将光之翼的博客

03-07

2万+

python ：中英文文本预处理（包含去标点/分词/词干提取） &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;在做文本分析之前，一般我们都需要进行文本的预处理。这一步其实和做数据时的数据清洗非常的相像。在对文本进行清洗的时候，我们需要分成中文和英文两种语言来进行，因为语言的不同，我们需要进行的操作也不同：英文：大小写的处理，标点符号的处理，文本的分词，去除停用词，以及词干的提取(cle...

在python中使用正则表达式实现中英文符号互换

数据探索者的博客

06-06

3278

在进行中文信息处理时，经常会发现有人错误地使用了英文半角的标点符号，给下一步处理造成一些麻烦。如果逐个地判断（使用循环方法）后进行替换，是一件非常费时费力的事情；当出现新的情况时，进行程序的更新也比较麻烦。利用unicode编码的规律和正则表达式中的替换（re.sub）功能，可以较为优雅地达到这个目的。 标点符号在unicode中的编码规律每个符号都有一个唯一的unicode编码，可以通过内置函...

参与评论您还未登录，请先登录后发表或查看评论

Python 去英文标点

持之以恒

06-18

5375

版本：3.4.1

Python处理中文标点符号大集合

09-20

中文文本中可能出现的标点符号来源比较复杂，通过匹配等手段对他们处理的时候需要格外小心，防止遗漏，下面小编给大家带来了Python处理中文标点符号大集合，感兴趣的朋友跟随脚本之家小编一起看看吧

python之中文符号转英文符号

He的博客

04-06

2086

方法一：　　maketrans方法，它使用的是一种映射关系来将(中文字符)转换为(英文字符)，前提需要维护映射关系数据，也就是你维护了(中文符号)，你也得维护其对应的(英文符号)，且两边的数量得保持一致，否则会报错　　优点：可以一次性转换多个符号或字符，拓展性强。缺点是代码长了点 (中文符号)转(英文符号) # 定义中文符号 chinese_character = r'，。！？；：(...

如何使用python将中文标点转为英文标点?

热门推荐

大数据-攻城狮

10-15

1万+

1.unicode有个normalize的过程，按照unicode标准，有C、D、KC、KD四种，KC会将大部分的中文标点符号转化为对应的英文，还会将全角字符转化为相应的半角字符，比如： import unicodedata t = u'中国，中文，标点符号！你好？１２３４５＠＃【】+=-（）' t2 = unicodedata.normalize('NFKC', t) ''' >&g...

Python中文标点符号转英文标点符号

Koevas的博客

12-28

7014

在学python爬虫中，爬取到的数据要经过筛选导入数据库，我们爬到的数据通常用.txt存放，然后通过逗号分隔进行导入数据库，但是，一些网站中获取到的数据是自带中文逗号分隔，所以要中文标点符号转英文标点符号，才能顺利导入例：第5期，宝马520i，众筹170000元，分红4045.95元，万元收益231.2元，年化收益率10.05%，80天转换为英文逗号 s=&quot;第5期，宝马520i，众筹1700...

python将中文标点符号转换成英文标点符号然后再替换成回车符实现换行

kxltsuperr的专栏

09-25

527

你发现没,杭州亚运会首个比赛日上午，中国体育代表团竟然狂揽11金！这一壮丽景象背后，是中国体育事业的坚实基础和精湛训练的见证。全部替换成英文标点符号后，就可以更顺利的将标点符号全部替换成想要的字符，比如回车符。标点符号都是中文状态下的。现在要替换成英文标点符号。

python将文件中的标点符号转为空格

09-19

在Python中，你可以使用正则表达式库`re`来替换文件中的标点符号为空格。首先，需要打开文件并读取内容，然后执行替换操作，最后再将处理后的文本写回原文件或者创建一个新的文件。下面是一个简单的示例： ```...

python使用正则表达式去除中文文本多余空格，保留英文之间空格方法详解

01-21

在pdf转为文本的时候，经常会多出空格，影响数据观感，因此需要去掉文本中多余的空格，而文本中的英文之间的正常空格需要保留，输入输出如下： input：我今天赚了 10 个亿，老百姓very happy。 output：我今天赚了...

xml转为txt，删除所有的标点符号，文本全变成小写

最新发布

10-05

将XML转换成纯文本文件（TXT），并移除所有标点符号并将文本全部转换为小写，你可以采用以下步骤： 1. 首先，你需要解析XML文件。如果你使用的是Python，可以使用`xml.etree.ElementTree`库来处理XML内容。 ```...

python替换把写错的中文符号都替换成英文方法

小木可的博客

10-24

1223

直接调用这个方法就好了。

python将中文标点与英文全角标点转英文半角

wangziyang777的博客

04-14

1434

def C_trans_to_E(string): C_pun = u'，。！？【】（）《》“‘：；［］｛｝&，．？（）＼％－＋￣~＄#＠=＿、／' E_pun = u',.!?[]()<>"\':;[]{}&,.?()\\%-+~~$#@=_//' table = {ord(f): ord(t) for f, t in zip(C_pun, ...

python把中文转英文_Python 3.0_文本清洗之中文特殊符号转英文特殊符号及全角字符转半角字符...

weixin_39980893的博客

11-24

1044

在文本清洗的过程，特殊符号的不规范是比较麻烦的事情，所以需要把文本中的特殊符号按照统一的标准处理。以下代码的作用就是将中文的特殊符号统一转成英文的，以及将全角符号转换成半角符号。参考代码# -*- coding: GBK -*-import redef strQ2B(ustring):"""中文特殊符号转英文特殊符号"""#中文特殊符号批量识别pattern = re.compile('[，。：“...

【前端技巧】中文符号转英文符号&全角字符转半角字符

Outman's blog

10-28

1150

【代码】【前端技巧】中文符号转英文符号&全角字符转半角字符。

中文标点符号转英文标点符号

hzpscsnd的博客

11-08

867

汉英字符转换（标点符号）

python实现具有删除空格、英文标点替换、英文单词大写等功能的文字排版工具

lanheit的博客

04-12

6268

编写代码，实现具有删除空格、英文标点替换、英文单词大写等功能的文字排版工具。原始文本为" 他问,你知道’cba’是什么单词的缩写么 ? " # .文字排版 str = " 他问,你知道'cba'是什么单词的缩写么 ? " print("1.删除空格\n2.英文标点替换\n3.英文单词大写\n4.退出") for i in range(1, 6): add = int(input("请输入功能选项:\n")) if i < 5: if ad

中英文标点符号切换的组合键_切换中英文标点快捷键

weixin_29487179的博客

12-23

5308

切换中英文标点快捷键,输入法的全半角之间的转换快捷键,输入法不见了以及输入法状态条不见之解决方法!1、切换中英文标点的快捷键:ctrl+。(句号)2、输入法的全角和半角之间的转换快捷键:shift+空格3、输入法的切换ctrl+空格4、在中文输入法里输入英文按shift5、输入法不见了:方法1：在任务栏单击鼠标右键，弹出快捷菜单，把鼠标移动到“工具栏”上，会弹出子菜单，看看其中的“语言栏”有没有...

使用Python将非英文字符转换为英文字符的方法

weixin_44532539的博客

06-21

609

你可以创建一个映射表，将特定的非英文字符转换为对应的英文字符。# 可以根据需要添加更多字符映射。