情况是从数据库读取content 然后拿正则去匹配电话号码
89个匹配 匹配成功了88个 有一个怎么看都应该匹配成功的 一度以为是正则写坏了 看了很久都找不出问题
然后把它复制到程序里 却一下就匹配了出来
百思不得其解
经过EAST大神点拨,将从数据库查出的content 用utf8 encode了一下 直接就ok了
元那里看起来一模一样的字符 unicode和utf8也是不一样的……
虽然已经时刻提醒自己 处理文本先统一文本编码 但是没想到匹配电话号也会遇到这个问题
看来以后再一出问题就encode一下 才稳稳的 不错过任何疏漏
据说python3已经解决了这个坑