opencc库用于转换中文到繁体等。
注明:
“”"
s2t.json简体中文到繁体中文 简体到繁体
t2s.json繁体中文转简体中文 繁体到简体
s2tw.json简体中文到繁体中文(台湾标准) 简体到台湾正体
tw2s.json繁体中文(台湾标准)到简体中文台湾正体到简体
s2hk.json简体中文到繁体中文(香港变体) 简体到香港繁体
hk2s.json繁体中文(香港变体)到简体中文 香港繁体到简体
s2twp.json简体中文到繁体中文(台湾标准)与台湾语成语简体到繁体(台湾正体标准)并转换为台湾常用词汇
tw2sp.json繁体中文(台湾标准)到简体中文与大陆语成语繁体(台湾正体标准)到简体并转换为中国大陆常用词汇
t2tw.json繁体中文(OpenCC标准)到台湾标准繁体(OpenCC 标准)到台湾正体
hk2t.json繁体中文(香港变体)到繁体 香港繁体到繁体(OpenCC 标准)
t2hk.json繁体中文(OpenCC标准)到香港变体 繁体(OpenCC 标准)到香港繁体
t2jp.json繁体中文(Kyūjitai)到新日语汉字(新字台)繁体(OpenCC 标准,旧字体)到日文新字体
jp2t.json新日语汉字(新字台)到繁体汉字(Kyūjitai) 日文新字体到繁体(OpenCC 标准,旧字体)
tw2t.json繁体中文(台湾标准)到繁体中文台湾正体到繁体(OpenCC 标准)
“”"
代码:
import sys
import opencc
input_file = sys.argv[1]
output_file = sys.argv[2]
code_name = sys.argv[3]
"""
code—name-----------------
s2t.json简体中文到繁体中文 简体到繁体
t2s.json繁体中文转简体中文 繁体到简体
s2tw.json简体中文到繁体中文(台湾标准) 简体到台湾正体
tw2s.json繁体中文(台湾标准)到简体中文台湾正体到简体
s2hk.json简体中文到繁体中文(香港变体) 简体到香港繁体
hk2s.json繁体中文(香港变体)到简体中文 香港繁体到简体
s2twp.json简体中文到繁体中文(台湾标准)与台湾语成语简体到繁体(台湾正体标准)并转换为台湾常用词汇
tw2sp.json繁体中文(台湾标准)到简体中文与大陆语成语繁体(台湾正体标准)到简体并转换为中国大陆常用词汇
t2tw.json繁体中文(OpenCC标准)到台湾标准繁体(OpenCC 标准)到台湾正体
hk2t.json繁体中文(香港变体)到繁体 香港繁体到繁体(OpenCC 标准)
t2hk.json繁体中文(OpenCC标准)到香港变体 繁体(OpenCC 标准)到香港繁体
t2jp.json繁体中文(Kyūjitai)到新日语汉字(新字台)繁体(OpenCC 标准,旧字体)到日文新字体
jp2t.json新日语汉字(新字台)到繁体汉字(Kyūjitai) 日文新字体到繁体(OpenCC 标准,旧字体)
tw2t.json繁体中文(台湾标准)到繁体中文台湾正体到繁体(OpenCC 标准)
"""
with open('./' + input_file,'r',encoding='utf-8') as f,open('./'+ output_file,'w',encoding='utf-8') as f1:
for itime in f.readlines():
converter = opencc.OpenCC(code_name)
a = converter.convert(itime.strip()) # 漢字
f1.write(f"{a}\n")
运行方式:
python opencc_text.py 输入文本文件 输出文件名 code