[b]Maxent[/b]
使用张乐博士的软件包时,要注意:
1. 空格和table都是分隔符,同时出现在语料中,会造成错误,但信息会打印出来。
2. 在8G内存的情况下,可容纳最大量,大约为1200万*5。
3. 注意最大熵不能识别,同一个event中,相同的feature,要加以区分。
[b]CRF++[/b]
在使用CRF++时要注意:
1. segment fault错误,可能是由于连续两个空行做成的。
2. 在小数量的特征很多时,-f参数对于提高训练速度,有很大的作用。
3. -p 后面最好接奇数,否则,跑不起来。
都是最近遇到的问题,随便写写。
使用张乐博士的软件包时,要注意:
1. 空格和table都是分隔符,同时出现在语料中,会造成错误,但信息会打印出来。
2. 在8G内存的情况下,可容纳最大量,大约为1200万*5。
3. 注意最大熵不能识别,同一个event中,相同的feature,要加以区分。
[b]CRF++[/b]
在使用CRF++时要注意:
1. segment fault错误,可能是由于连续两个空行做成的。
2. 在小数量的特征很多时,-f参数对于提高训练速度,有很大的作用。
3. -p 后面最好接奇数,否则,跑不起来。
都是最近遇到的问题,随便写写。