【Python】opencc库简单使用

opencc库用于转换中文到繁体等。
注明:
“”"
s2t.json简体中文到繁体中文 简体到繁体
t2s.json繁体中文转简体中文 繁体到简体
s2tw.json简体中文到繁体中文(台湾标准) 简体到台湾正体
tw2s.json繁体中文(台湾标准)到简体中文台湾正体到简体
s2hk.json简体中文到繁体中文(香港变体) 简体到香港繁体
hk2s.json繁体中文(香港变体)到简体中文 香港繁体到简体
s2twp.json简体中文到繁体中文(台湾标准)与台湾语成语简体到繁体(台湾正体标准)并转换为台湾常用词汇
tw2sp.json繁体中文(台湾标准)到简体中文与大陆语成语繁体(台湾正体标准)到简体并转换为中国大陆常用词汇
t2tw.json繁体中文(OpenCC标准)到台湾标准繁体(OpenCC 标准)到台湾正体
hk2t.json繁体中文(香港变体)到繁体 香港繁体到繁体(OpenCC 标准)
t2hk.json繁体中文(OpenCC标准)到香港变体 繁体(OpenCC 标准)到香港繁体
t2jp.json繁体中文(Kyūjitai)到新日语汉字(新字台)繁体(OpenCC 标准,旧字体)到日文新字体
jp2t.json新日语汉字(新字台)到繁体汉字(Kyūjitai) 日文新字体到繁体(OpenCC 标准,旧字体)
tw2t.json繁体中文(台湾标准)到繁体中文台湾正体到繁体(OpenCC 标准)
“”"
代码:

import sys

import opencc
input_file = sys.argv[1]
output_file = sys.argv[2]
code_name = sys.argv[3]
"""
code—name-----------------
s2t.json简体中文到繁体中文 简体到繁体
t2s.json繁体中文转简体中文 繁体到简体
s2tw.json简体中文到繁体中文(台湾标准) 简体到台湾正体
tw2s.json繁体中文(台湾标准)到简体中文台湾正体到简体
s2hk.json简体中文到繁体中文(香港变体) 简体到香港繁体
hk2s.json繁体中文(香港变体)到简体中文 香港繁体到简体
s2twp.json简体中文到繁体中文(台湾标准)与台湾语成语简体到繁体(台湾正体标准)并转换为台湾常用词汇
tw2sp.json繁体中文(台湾标准)到简体中文与大陆语成语繁体(台湾正体标准)到简体并转换为中国大陆常用词汇
t2tw.json繁体中文(OpenCC标准)到台湾标准繁体(OpenCC 标准)到台湾正体
hk2t.json繁体中文(香港变体)到繁体 香港繁体到繁体(OpenCC 标准)
t2hk.json繁体中文(OpenCC标准)到香港变体 繁体(OpenCC 标准)到香港繁体
t2jp.json繁体中文(Kyūjitai)到新日语汉字(新字台)繁体(OpenCC 标准,旧字体)到日文新字体
jp2t.json新日语汉字(新字台)到繁体汉字(Kyūjitai) 日文新字体到繁体(OpenCC 标准,旧字体)
tw2t.json繁体中文(台湾标准)到繁体中文台湾正体到繁体(OpenCC 标准)
"""
with open('./' + input_file,'r',encoding='utf-8') as f,open('./'+ output_file,'w',encoding='utf-8') as f1:

    for itime in f.readlines():

        converter = opencc.OpenCC(code_name)
        a = converter.convert(itime.strip())  # 漢字
        f1.write(f"{a}\n")

运行方式:

python opencc_text.py 输入文本文件 输出文件名 code
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值