简体繁体转换
如今,世界上存在两种中文,一种是中文简体,一种是中文繁体。如果要完全掌握中文语言的自然语言处理,那么简繁都不可避免。所以,掌握了简体与繁体的转换,往往能够事半功倍。
而HanLP也提供了简繁转换的类:CharTable,用它来执行字符正规化。比如简体转换繁体,全角转换半角,大写转换小写,都可以使用该类来实现。
使用CharTable进行简繁体转换
下面,我们来直接使用CharTable进行一段诗词的繁体到简单的转换。具体代码如下所示:
if __name__ == "__main__":
CharTable=JClass('com.hankcs.hanlp.dictionary.other.CharTable')
print(CharTable