- 博客(12)
- 资源 (1)
- 收藏
- 关注
转载 防止过拟合的正则化项
感叹知乎上的大牛们啊,解释的相当到位,作为计算机小白来说,感觉非常容易理解,所以在这里转载了!https://www.zhihu.com/question/20924039机器学习中常常提到的正则化到底是什么意思?举个例子 这是个基于多核的支持向量机的目标函数 d是多核函数的参数 它说r(d)是正则项。为什么要令r(d)为正则项,有什么目的?
2017-12-27 17:52:09 740
转载 详解 MNIST 数据集
http://blog.csdn.net/simple_the_best/article/details/75267863最近学习xgboost算法,看到好多代码样例中用到了这个测试集,所以学习一下!MNIST 数据集已经是一个被”嚼烂”了的数据集, 很多教程都会对它”下手”, 几乎成为一个 “典范”. 不过有些人可能对它还不是很了解, 下面来介绍一下.MNIST 数据集可
2017-12-18 11:39:46 1936
转载 gbdt的参数意义与设置
http://www.jianshu.com/p/005a4e6ac775重要参数的意义及设置推荐GBDT树的深度:6;(横向比较:DecisionTree/RandomForest需要把树的深度调到15或更高) 以下摘自知乎上的一个问答(详见参考文献8),问题和回复都很好的阐述了这个参数设置的数学原理。 【问】xgboost/gbdt在调参时为什么树的深度很少就能达到很高的
2017-12-12 17:12:35 5647
原创 python中的3d画图
python的3d散点图from sklearn.cluster import KMeansfrom sklearn.externals import joblibfrom sklearn import clusterimport numpy as np # 生成10*3的矩阵data = np.random.rand(100,3)print data# 聚类为4类es
2017-12-12 16:39:48 1122
转载 snownlp和jieba对比,被碾压的很惨
今天逛网页,无意中看到了有人写snownlp这个库用来处理文本的情感,出于好奇,出于安慰吧(因为这两天想装hanlp,结果没装上,总是报错,心情巨沮丧!!,所以逛着其他包替代hanlp)发现jieba的分词直接碾压snownlp的分词,snownlp的情感分析也是巨慢,其中把训练中包括了分词部分,巨慢,不可用的赶脚!举例如下:更多的例子就不再一一列举了!不过还是把介
2017-12-12 16:20:51 56509 4
转载 jupyter notebook 安装,使用
http://blog.csdn.net/tina_ttl/article/details/51031113Python·Jupyter Notebook各种使用方法记录·持续更新使用pip来安装Jupyter。输入安装命令pip install jupyter即可,大约需要几十秒钟运行:cmd->jupyter notebook 在网页上运行一、 Ju
2017-12-11 17:28:17 10022
转载 交叉验证(CrossValidation)方法思想简介
交叉验证 Cross-validationhttps://www.cnblogs.com/sddai/p/5696834.html交叉验证(CrossValidation)方法思想简介以下简称交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为
2017-12-11 16:53:16 2087
转载 npp正则使用,很方便,就是需要会正则,正则一直是偶头疼的东东
http://blog.sina.com.cn/s/blog_62b13cf20102wtlw.html下载notepad++并安装。从该地址下载notepad++:http://download.tuxfamily.org/notepadplus/6.6/npp.6.6.Installer.exe。下载后安装软件。使用notepad++打开需要处理的文
2017-12-11 15:13:36 474
原创 那些年的风,那些年的雨,那些年一起走过的风风雨雨
这并非一篇洋洋洒洒的散文,这是一篇规规矩矩的数据分析 骨子里的自己其实是充满了浪漫色彩的文艺小清新,而现实眼中的自己却是一枚屌丝IT女!与那个同为屌丝IT人事的他一起携手走过了近4个年头了!生活中点点滴滴都在简单的时光里慢慢的沦为了回忆,成为了不可触及的过去,常常想让时光慢一些,让我们有时间来细细品味这点点滴滴,而时间的脚步却从未放慢一点点!能留住的似乎都在记忆的硬盘里!马上又
2017-12-09 16:38:14 409 2
转载 OneHotEncoder
one_hot(独热码)官方示例的个人理解官方给的例子1234567891011from sklearn import preprocessing enc = preprocessing.OneHotEncoder()
2017-12-07 15:15:37 386
翻译 gbdt与逻辑回归融合
GBDT原理及利用GBDT构造新的特征-Python实现看了许多GBDT构建特征的资料整理而成,具体资料见Reference。背景Gradient BoostingGradient Boosting Decision TreeGBDT应用-回归和分类GBDT构建新的特征思想GBDT与LR融合方案源码内容generate GBD
2017-12-07 14:20:15 3795
转载 一个 11 行 Python 代码实现的神经网络
概要:直接上代码是最有效的学习方式。这篇教程通过由一段简短的 python 代码实现的非常简单的实例来讲解 BP 反向传播算法。代码如下:Python1234567891011X = np.array([ [0,0,1],[0,1,1],[1,0,1],[1,1,1] ]
2017-12-05 16:45:48 314
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人