python文件中写中文_用Python怎么把如下文件中的中文词条提取出来,并把这些中文做成json文件?...

import re

s = '''File:D:\svn\aCenter\windows\dap\store\vdidc\web\vue-ui\src\components\datetime_range.vue

content: 'default': '至'

Line: 24

Time: 2018-03-26 08:46:13

-------------------------------------------------------------------------------

File:D:\svn\aCenter\windows\dap\store\vdidc\web\vue-ui\src\components\piece.vue

content:

{{checkBranchNum}}个<

Line: 6

Time: 2018-03-26 08:46:13

-------------------------------------------------------------------------------

File:D:\svn\aCenter\windows\dap\store\vdidc\web\vue-ui\src\components\piece.vue

content:

分支

Line: 7

Time: 2018-03-26 0'''

p2 = re.compile(r'[^\u4e00-\u9fa5]')

result = {i: i for i in " ".join(p2.split(s)).strip().split()}

# {'个': '个', '至': '至', '分支': '分支'}

优雅的写在本地,比如你的文件是1.txt

import re

p2 = re.compile(r'[^\u4e00-\u9fa5]')

with open('1.txt', 'r') as r:

result = {i: i for i in ' '.join(p2.split(''.join(r.readlines()))).strip().split()}

print(result) # {'个': '个', '分支': '分支', '至': '至'}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值