Joint Sentiment/Topic Model & Aspect and Sentiment Unification Model
参考文章:Joint Sentiment/Topic Model for Sentiment Analysis
JST模型从文本检测情感和主题
之前的工作缺点:基于机器学习的情感分类需要大量的人工标记; 一个领域训练的情感分类模型不能很好地应用于另一个领域; 主题/特征检测和情感分类经常分开来进行,忽略了它们的相互依赖性。
JST模型
- 完全非监督,更加灵活,更容易适用于其他领域。
- 通过考虑相互联系同时检测情感/主题。
LDA & JST
- LDA
- 两个矩阵: D×T 分布(文档-主题): θ ; T×W 分布(主题-词): ϕ 。
- JST
- 3个矩阵: D×S 分布(文档-情感): π ; D×S×T 分布(文档-情感-主题): θ ; D×S×W 分布(文档-情感-词): ϕ 。
JST的过程
- 对每个文档d,选择一个分布 πd