python判断字符串是否含有非中文字符的日文/韩文字符

python从入门到放弃 专栏收录该内容
5 篇文章 0 订阅

需求描述

爬取推特内容,需要留下只有中文/英文的内容,日文/韩文不要。

实现思路

用正则表达式。
本来想能不能单独匹配中文或者英文,但是好多符号不想弄了…
就直接搜了匹配日文/韩文的正则表达式。

备注:匹配日文的好像只能匹配假名,如果是日文汉字就不行。

参考代码

import re
str = '输入需要匹配的字符'

jap = re.compile(r'[\u3040-\u309F\u30A0-\u30FF\uAC00-\uD7A3]')  # \uAC00-\uD7A3为匹配韩文的,其余为日文
if jap.search(str):
    print('Yes')
  • 0
    点赞
  • 0
    评论
  • 2
    收藏
  • 一键三连
    一键三连
  • 扫一扫,分享海报

相关推荐
©️2020 CSDN 皮肤主题: 黑客帝国 设计师:白松林 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值