nlp-problem
该问题可归类为监督性学习的分类问题。解决该问题的方法有:
普通的概率模型:如朴素贝叶斯,该模型最主要的缺点是无法捕捉词与词之间的上下文关系,特征与特征之间组合关系,因为该模型假设词与词之间是相互独立。
树型模型,如随机森林,提升树(xgboost,gdbt).该模型虽然很好地解决特征组合问题,但是对稀疏矩阵的效果不好,
特别是对针对当下的文本分类问题,因为one-hot处理后,形成巨大稀疏矩阵,几乎不可分割。
词向量化,比如word2vec,该模型是把词 word embedding 化,这样主
原创
2021-03-01 17:19:55 ·
208 阅读 ·
2 评论