3.20
正式开战!
(1)早上一直困扰于一个问题:读入gender.txt文件时出错,debug进去时发现乱码。
解决: 使用inputstreamReader来读,将编码设为"utf-8"即可。发现解决方法是浏览gender.txt时发现出现了非英语字符。从而想到gbk不兼容。
花费时间:3小时零12分钟。
(2)第二个问题:实验结果表示F值较低--40+,寻找原因。
花费时间:2个小时,无果。从Eclipse转到Netbeans又转回Eclipse。
下一步计划是对SemEval的数据进行预处理并进行实验,看实验结果。