- 博客(7)
- 资源 (5)
- 收藏
- 关注
原创 机器学习模型——SVM
1工具2公式线性可分的SVM1、工具LibLInear LIBSVM:台湾的2、公式线性可分的SVM:maxλ\max \lambda
2016-08-25 12:49:51 1139
原创 机器学习——基本概念
1、过拟合根据训练数据训练得到的模型在训练数据上拟合的很好,可是对其他数据的性能一般。这种现象称为过拟合。过拟合的原因就是把训练数据中的噪声点也学习了。过拟合技术:正则:正则项。目的是让参数不要过大,越接近0越好,所以正则技术也是一种降维技术。2、泛化能力根据训练数据学得的模型在其他数据集上表现也很好,即举一反三。
2016-08-21 19:35:30 448
转载 java——安装
If you want the easy route to installing and updating Oracle Java 8(including the JRE, JDK and plugins for browsers) on Ubuntu 12.04 (or later) then I recommend doing it this way. First delete the fil
2016-08-20 12:27:25 490
原创 python——log日志
import loggingimport os.pathimport sysif __name__ == '__main__': program = os.path.basename(sys.argv[0]) logger = logging.getLogger(program) logging.basicConfig(format='%(asctime)s:
2016-08-19 21:58:19 951
原创 python——main函数的参数(命令行参数)
import sys#main函数inp, outp1, outp2 = sys.argv[0:3]可以看出命令行参数是保存在sys.argv里面的,并且是以列表的形式保存的。
2016-08-19 21:48:13 8011
原创 python——word2vec
使用gensim提供的模型word2vec训练从网上获得的语料。gensim是Radim Řehůřek博士提供的库。word2vec的使用可以参考这篇文章:Word2vec Tutorial1、处理原始语料,得到word2vec需要的输入格式这次实验使用的语料是yelp(共2225213条)和amazon electronic(共计1689188条)上的评论语料,都是
2016-08-19 21:26:06 4050
Estimating the number of clusters in a data set via the gap statistic
2017-10-25
level-set. Osher 1988.
2017-10-18
Comparing LDA and SVM
2017-10-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人