编码识别-使用gcc在linux中编译google/compact_enc_det
compact_enc_det是google的开源编码检测项目,开源与github:
https://github.com/google/compact_enc_det.git
compact_enc_det可以用来检测给定的文本文件的编码类型,支持多种类型的文本:
enum TextCorpusType {
WEB_CORPUS,
XML_CORPUS,
QUERY_CORP...
原创
2019-08-29 09:19:57 ·
413 阅读 ·
0 评论