C#下虽然可以采用Microsoft.VisualBasic.Strings.StrConv()函数进行繁简转化(参考此文),但是存在转化不完全的问题。主要是部分异体字无法转化。
因此,我们根据异体字整理表和繁简字对照表来构建辅助字典,用于将未能成功转化的异体字或繁体字转化为简体字。
格式化的文档v2t.txt和s2t.txt放在了Github中。
1. RemoveVariant()查表去掉异体字
/// <summary>
/// 查表去掉异体字
/// </summary>
/// <param name="source"></param>
/// <returns></returns>
private