- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 AutoEncoder的一些实验结果和思考
之前看Autoencoder的时候,做了一下这里的练习:http://ufldl.stanford.edu/wiki/index.php/Exercise:Sparse_Autoencoder 。其实 从1月份就开始做了,当时没有调试通过,后来又加班太多,一直没有接着做。直到上上周末抽空调了一天,终于顺利完成了,又拖到这周末才开始把实验结果整理成文。看来,做事还得趁热打铁,一气呵成。时间一久,积极
2014-05-24 21:19:21 2750
原创 构造NLP标注集的几个简便方法&随想
基于统计的NLP算法或模型的性能关键在于语料库,但带标注的语料库不容易获得。这里介绍几个构造训练集或测试集的简便方法,在没有足够标注集的情况下可以采用。1.词义消歧 用固定字符串替换多词。如,用词符串“8888”替换语料中出现的“屌丝”和“高富帅”,其中“8888”是歧义词,其含义可能为“屌丝”或“高富帅”,以此类推构造其他词汇,这样就得到了一个人工标注的歧义语料库。该方法可用于构造训练
2014-05-23 11:04:34 2097
原创 《统计自然语言处理基础》中文版翻译勘误表,持续更新
8.6 C 191 E 310“It is also importantto note that this type of study only gets at character strings thatare entirely missing from the dictionary” 8.6 C 192 E 311“It took a long
2014-05-13 11:58:16 1067
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人