数据挖掘
天然呆的技术博客
纯天然的技术小呆呆
展开
-
文本分类学习
统计学习方法其实就是一个两阶段的解决方案,(1)训练阶段,由计算机来总结分类的规则;(2)分类阶段,给计算机一些它从来没见过的文档,让它分类原创 2014-09-30 15:35:06 · 830 阅读 · 0 评论 -
webmagic_dependency
us.codecraft webmagic-extension 0.5.1 org.slf4j slf4j-log4j12原创 2014-10-14 10:26:32 · 762 阅读 · 0 评论 -
网页主题提取研究
1,张志刚等提出一组启发式原创 2014-10-13 15:13:21 · 969 阅读 · 0 评论 -
Deep Learning(深度学习)
Deep Learning(深度学习)ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):一ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):二Bengio团队的deep learning教程,用的theano库,主要是rbm系列,搞python的可以参考,很不错。deeplearning.net主页,里面包含的转载 2014-10-16 00:32:49 · 1389 阅读 · 0 评论 -
机器学习笔记
机器学习问题方法总结 - Orisun - 博客园 var currentBlogApp = 'zhangchaoyang', cb_enable_mathjax=true;load_page_begin_html();华夏35度Data Mining 机器学习问题方法总结 大类名称关键词有监督分类决策树原创 2014-11-27 19:26:57 · 541 阅读 · 0 评论 -
Mahout学习一
1,二进制转换成文本格式命令mahout seqdumper -i output/clusterPoint -o dataSet/clusterPoint原创 2015-07-26 13:21:52 · 615 阅读 · 0 评论 -
Mahout学习三--逻辑回归预测
1,训练样本mahout trainlogistic --input dataset/donut.csv \--output ./model \--target color --categories 2 \--predictors x y --types numeric \-- features 20 --passes 100 --rate 502,mahout r原创 2015-07-26 19:02:08 · 2122 阅读 · 0 评论