文本分析系列的文章是我在2012~2013年做某个项目的笔记和资料整理而成,所提到的算法/实现方式都最终应用于项目开发,而并非只是概念上,当然文本分析领域非常大也非常艰深(包括google在内的大公司都有深入的研究和产品),以下的文章资料仅限于文本的零和判断、关联判断、排重、分类:
特征抽取
文本分析系列——文本特征抽取
文本判断
文本分析系列——基于词库的文本是非判断计算
文本分类
文本分析系列——基于向量空间模型的文本分类方法
(链接陆续更新…)
文本分析系列的文章是我在2012~2013年做某个项目的笔记和资料整理而成,所提到的算法/实现方式都最终应用于项目开发,而并非只是概念上,当然文本分析领域非常大也非常艰深(包括google在内的大公司都有深入的研究和产品),以下的文章资料仅限于文本的零和判断、关联判断、排重、分类:
特征抽取
文本分析系列——文本特征抽取
文本判断
文本分析系列——基于词库的文本是非判断计算
文本分类
文本分析系列——基于向量空间模型的文本分类方法
(链接陆续更新…)