机器翻译
Honei_X
本人木讷
展开
-
英文分词的算法和原理
英文分词的算法和原理 转载:http://itindex.net/detail/48243-%E8%8B%B1%E6%96%87-%E5%88%86%E8%AF%8D-%E7%AE%97%E6%B3%95?utm_source=tuicool&utm_medium=referral 根据文档相关性计算公式 TF-IDF: http://lutaf.com/210.htmBM25: http://l转载 2017-09-20 09:48:10 · 836 阅读 · 0 评论 -
训练集(train set) 验证集(validation set) 测试集(test set)
http://blog.csdn.net/liulina603/article/details/44831257 一, 训练样本和测试样本 训练样本的目的是 数学模型的参数,经过训练之后,可以认为你的模型系统确立了下来。 一般训练样本和测试样本相互独立,使用不同的数据。 在有监督(supervise)的机器学习中,数据集常被分成2~3个,即:训练集(train set) 验证集(valid转载 2017-10-10 08:31:43 · 2273 阅读 · 0 评论