1.自然语言处理基本入门
https://www.cnblogs.com/loubin/p/13669279.html
2. 文本处理流程
https://www.cnblogs.com/loubin/p/13675909.html
https://www.cnblogs.com/loubin/p/13680684.html
常见分词工具:jieba分词,snowNLP,LTP,HanNLP
常见分词算法:前向最大匹配算法、后向最大匹配算法、维特比算法
3. 纠错算法
https://www.cnblogs.com/loubin/p/13692813.html
4. 词的标准化
https://www.cnblogs.com/loubin/p/13697695.html
词的标准化,有两种常用的技术,一种是stemming,另一种是lemmazation