Python全角和半角之间相互转换

最新推荐文章于 2024-04-18 18:00:00 发布

埃菲尔没有塔尖

最新推荐文章于 2024-04-18 18:00:00 发布

阅读量1.6k

点赞数 2

分类专栏：【Python高级】

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38819889/article/details/103288086

版权

1.应用领域：

全角和半角的转换通常用在自然语言处理过程中，由于全角和半角的不一致会导致信息抽取不一致，在使用语料训练语言模型会导致模型的效果不准确，所以需要统一。

2.全角半角转换概述

全角字符unicode编码范围从65281~65374 （对应的十六进制范围是: 0xFF01 ~ 0xFF5E）
半角字符unicode编码范围从33~126 （对应的十六进制范围从 0x21~ 0x7E）
空格比较特殊,全角为12288（0x3000）,半角为 32 （0x20）
除空格外，全角/半角按unicode编码排序在顺序上是对应的（半角 +65248 = 全角 or 半角 + 0x7e= 全角）
所以可以直接通过用±法来处理非空格数据,对空格单独处理

3.请注意：

中文文字永远是全角，只有英文字母、数字键、符号键才有全角半角的概念。
一个字母或数字占一个汉字的位置叫全角，占半个汉字的位置叫半角。

引号在中英文、全半角情况下是不同的
在这里插入图片描述

4.应用到的库函数

chr()函数用一个范围在range（256）内的（就是0～255）整数作参数，返回一个对应的字符。

最低0.47元/天解锁文章

埃菲尔没有塔尖

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。