- 博客(0)
- 资源 (2)
- 收藏
- 关注
支持简单多音字的高速拼音转换.rar
pinyin4j效率有点低,尝试改进一版
最近项目里面有几百万条数据要转换拼音和拼音首字母,用的pinyin4j发现字库不行,很多繁体字、生僻字、异体字识别不出来,而且多音字也不支持,就用了某个同学的代码,结果使用时发现,cpu高的不要不要的,调试时发现大量的map寻址操作,外加map的线程不安全性,决定重新写一个。
由于好多年没写代码了,希望看客见谅。
跑了一下测试,支持比较简单的多音字,速度还不错,200w次用时不超5秒,而对比的同学的工具,基本上2000条要50秒,而pinyin4j大概1w次在30秒
主要是用了一个全unicode中文的拼音对照表做的,感谢分享资源的同学。
2019-08-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人