python全角和半角之间的转换

博客内容讲述了在处理文本时遇到全角空格无法匹配的问题,分析了全角和半角字符的Unicode编码规律,特别指出全角空格的编码为12288,半角空格为32。除空格外,全角和半角字符可以通过特定的转换方法进行对应处理。
摘要由CSDN通过智能技术生成

源文件格式如下:

11387164	1994/m 年/q 7/m  /n 月/n ,/w 完成/v 第二/m 稿/Ng

11387163	 /n 1992/m 年/q 底/f ,/w 在/p 妞妞/nr 死/v 后/f 一/m 年/q ,/w 我/r 把/p 自己/r 关/v 在/p 屋/n 里/f ,/w 开始/v 写/v 这/r 本/q 书/n ,/w 于/p 1993/m 年/q  /n 7/m 月/n 写/v 出/v 初稿/n

目标去掉词性标注


结果发现中间的空格没去掉,最后发现原因是:全角的空格无法匹配


对应的编码为:<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值