- 博客(5)
- 收藏
- 关注
转载 solr教程
Solr调研总结开发类型全文检索相关开发Solr版本4.2文件内容本文介绍solr的功能使用及相关注意事项;主要包括以下内容:环境搭建及调试;两个核心配置文件介绍;维护索引;查询索引,和在查询中可以应用的高亮显示、拼写检查、搜索建议、分组统计、拼音检索等功能的使用方法。版本作者/修改人日期V1.0gzk2013-06-041. Solr 是什么?Solr它是一种开放源码的、基于 Lucene Ja...
2018-06-05 14:39:41 1206
转载 ROC曲线与AUC
对于0,1两类分类问题,一些分类器得到的结果往往不是0,1这样的标签,如神经网络,得到诸如0.5,0,8这样的分类结果。这时,我们人为取一个阈值,比如0.4,那么小于0.4的为0类,大于等于0.4的为1类,可以得到一个分类结果。同样,这个阈值我们可以取0.1,0.2等等。取不同的阈值,得到的最后的分类情况也就不同。如下面这幅图:蓝色表示原始为负类分类得到的统计图,红色为正类得到的统计图。那么我们取...
2018-05-24 11:36:25 287
转载 weka数据预测 分类回归 方法 参数 总结
1.线性回归(LinearRegression)1.1原理在统计学中,线性回归是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。1.2最小二乘法原理线性回归模型经常用最小二乘逼近来拟合,但他们也可能用别的方法来拟合,比如用最小化“拟合...
2018-05-24 09:11:36 1074
转载 训练集(train set) 验证集(validation set) 测试集(test set)
在有监督(supervise)的机器学习中,数据集常被分成2~3个,即:训练集(train set) 验证集(validation set) 测试集(test set)。一般需要将样本分成独立的三部分训练集(train set),验证集(validation set)和测试集(test set)。其中训练集用来估计模型,验证集用来确定网络结构或者控制模型复杂程度的参数,而测试集则检验最终选择最优的...
2018-05-21 11:40:01 1171
转载 神经网络
1、什么是神经网络?神经网络是由简单处理单元构成的大规模并行分布式处理器,天然地具有存储经验知识和使之可用的特性。神经网络在两个方面与大脑相似:1.神经网络是通过学习过程从外界环境中获取知识的。 2.互连神经元的连接强度,即突触权值,用于存储获取的知识用于完成学习过程的程序称为学习算法,其功能是以有序的方式改变网络的突触权值以获得想要的设计目标。 2、神经网络的优点神经网络的大规模并行分布式结构;...
2018-05-21 11:15:00 1445
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人