- 博客(4)
- 资源 (16)
- 收藏
- 关注
原创 python并行调参——scikit-learn grid_search
上篇应用scikit-learn做文本分类中以20newsgroups为例讲了如何用三种方法提取训练集=测试集的文本feature,但是vectorizer取多少个word呢?预处理时候要过滤掉tf>max_df的words,max_df设多少呢?tfidftransformer只用tf还是加idf呢?classifier分类时迭代几次?学习率怎么设?……“循环一个个试过来啊”……啊好吧,matlab里就是这么做的……好在scikit-learn中提供了pipeline(for estimat
2014-04-17 14:12:28 35756 16
原创 应用scikit-learn做文本分类
文本挖掘的paper没找到统一的benchmark,只好自己跑程序,走过路过的前辈如果知道20newsgroups或者其它好用的公共数据集的分类(最好要所有类分类结果,全部或取部分特征无所谓)麻烦留言告知下现在的benchmark,万谢!嗯,说正文。20newsgroups官网上给出了3个数据集,这里我们用最原始的20news-19997.tar.gz。分为以下几个过程:1.加载数据集2.提feature3.分类{Naive Bayes,KNN,SVM}4.聚类说明: scipy官网上有参考
2014-04-13 20:53:15 99223 50
原创 Ubuntu12.04配置NVIDIA cuda5.5经验帖
之前配过一遍都忘光了,现在要重新配一遍真是好难过。。。特此记录参考网站以便查阅。=============环境:Ubuntu 12.04+Cuda5.51. 判断安装环境:The setup of CUDA development tools on a system running the appropriate version of Linux consists of a few simple
2014-04-06 08:58:32 25626 16
LR_Mnist.py
2015-01-07
deep learning 概览+时序模型
2014-05-29
Convolution Neural Network (CNN)
2014-05-15
人脸检测与识别
2014-03-16
决策树python实现
2014-03-10
KMeans和Kmedoid算法的matlab实现
2012-11-18
C++矩阵处理工具——Eigen3
2012-07-24
Difference of Gaussian DoG
2012-06-09
动态规划基础(初学者必读)
2009-10-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人