主题模型是一种能够从文本数据中发现隐藏主题结构的统计模型。在深度学习领域,有许多方法可以用来评估主题模型的质量和性能。本文将介绍一些常用的主题模型量化评估指标,并提供相应的源代码。
- 对数似然度(Log Likelihood)
对数似然度是一种常用的主题模型评估指标,用于衡量模型生成观测数据的能力。较高的对数似然度表示模型更好地拟合了数据。以下是使用Python计算对数似然度的示例代码:
import numpy as np
def log_likelihood(model, corpus):
total_log_likelihood = 0
for document in corpus:
doc_log_likelihood = model