小编码大阻力

最新推荐文章于 2019-09-06 14:35:01 发布

Do395614269

最新推荐文章于 2019-09-06 14:35:01 发布

阅读量1k

点赞数

分类专栏： Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010189918/article/details/20698847

版权

一、匹配汉字

实现一个从档案中提出指定中文后对应数字的小程序，如：

很多很多的信息····

张三：18 张三其它的信息·····

很多很多的信息····

思路：

1.不能确定每个文件中都有张三这个人，所以要先判断一下张三在不在。

2.用张三把他前后的文字分隔开，再从后面的文字中挑选需要的。

一直提示错误，说是编码不对。

更正点：

1.我习惯这样来表达：u”张三“，这是把它转换成unicode，和文件中的原有编码是不一致的。所以此时应直接用“张三”。

name1 = "张三"
name2 = u"张三"
text = "我是张三"
name1 in text
True
name2 in text
False

2.注意文件的原有编码是什么，我这次收到的文件是gbk的，而之前一直都是utf-8，所以就遗漏了这个问题。因为需要批量处理文件，而文件名又是时间，于是用了一个偷懒的方法去实现转码问题。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
小编码大阻力

写一个从档案中提出指定中文的小程序一直提示错误
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。