数据挖掘
Sweblish
什么都好,就是一个缺点。
展开
-
特征选择算法之卡方检验
转自:http://www.blogjava.net/zhenandaci/archive/2008/08/31/225966.html前文提到过,除了分类算法以外,为分类文本作处理的特征提取算法也对最终效果有巨大影响,而特征提取算法又分为特征选择和特征抽取两大类,其中特征选择算法有互信息,文档频率,信息增益,开方检验等等十数种,这次先介绍特征选择算法中效果比较好的开方检验方法。大转载 2013-07-20 10:02:33 · 9490 阅读 · 0 评论 -
表情编码
iphone上面的/ue415就是表情编码。更多的表情如下:类似QQ表情 (unicode emoji字符集)" height="20" width="20" style="border:0px; max-width:100%; margin:0px; padding:0px"> /ue415类似QQ表情 (unicode emoji字符集)" height="转载 2013-08-06 15:47:30 · 3369 阅读 · 0 评论 -
数据分析的评测标准
用户满意度预测准确性原创 2014-11-07 23:57:13 · 1157 阅读 · 0 评论 -
文本分类——Naive Bayes
文本分类——Naive Bayes 文本分类——Naive Bayes 1 Naive Bayes算法介绍 说起贝叶斯算法,不得不先提到概率论与数理统计课程里面的条件概率公式,对于随机试验E有两个随机事件A,B,且P(B) > 0 那么在B事件发生的条件下A发生的概率为: 其中P(AB)为A,B两个事件的联合概率。对上式利用乘法公式可以变形为:转载 2014-11-22 18:55:08 · 1029 阅读 · 0 评论 -
solr安装与配置
前提准备:环境必须是tomcat7.0以上,jdk7.0以上,jre7.0以上,且配置好环境变量。从官网下载最新版本1、解压并将solr-4.10.2/example/webapps 下的solr.war拷贝到webapps下手动启动tomcat解压solr.war。2、将apache-tomcat-7.0.42/webapps/solr/WEB-INF下的web.原创 2014-12-17 14:15:59 · 8634 阅读 · 0 评论