在使用GibbsLDA++-0.2的时候,碰到错误 “Invalid (empty) document!”
因为我用的是中文文档,虽然深信这个和语言没有太大关系,但还是网上查询了一些相关资料,无果。
经过一段时间的琢磨,发现出现这种情况请保证:
1. 文档确实存在
2. 文档中的格式需要按照指定格式存储
3. 文档中第一行的文档数和真实文档数要匹配
4. 文档中不能有空行
以上任何一种情况不满足都会导致上述错误,记住在我们分词结束之后活着在替换之后可能会有出现空行,这个自己在写程序的时候自己稍加控制就可以了。