文本分类
文章平均质量分 78
Sweety_Wei
好好工作,认真生活,坚持锻炼,保持微笑!
展开
-
用户商品评论自动分类
商品评论自动分类 实习阶段的任务是对商品评论信息进行自动分类,主要针对的是家用电器商品评论数据,现在实习要结束了,来总结一下实现这一任务的主要流程。 一语料库的准备 商品评论数据的主要特点: 1)评论一般较短,并且语言口语化,没有标准的语法规则,经常出现网络词汇 2)评论一般涉及商品的多个属性 针对这些特点,我将评论拆分成句子,然原创 2015-01-30 15:22:14 · 2156 阅读 · 0 评论 -
N-gram语言模型文本分类器
N-gram语言模型文本分类器 一 语言模型(Language Model LM) 1、定义 假设一个字符串w=w1w2….wn; wi可以是一个字,一个词或者一个短语 我们把一个可以计算 P(W) 或者P(wn|w1,w2…wn-1) 的模型称为语言模型,Language model,或者写成LM。 目的:在给定语料库的情况下,计算一个字符串出现的概率 作用:a、机器翻译 P(h原创 2015-02-04 10:29:28 · 6260 阅读 · 1 评论