自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (1)
  • 收藏
  • 关注

转载 防止过拟合的正则化项

感叹知乎上的大牛们啊,解释的相当到位,作为计算机小白来说,感觉非常容易理解,所以在这里转载了!https://www.zhihu.com/question/20924039机器学习中常常提到的正则化到底是什么意思?举个例子 这是个基于多核的支持向量机的目标函数 d是多核函数的参数 它说r(d)是正则项。为什么要令r(d)为正则项,有什么目的?

2017-12-27 17:52:09 740

转载 详解 MNIST 数据集

http://blog.csdn.net/simple_the_best/article/details/75267863最近学习xgboost算法,看到好多代码样例中用到了这个测试集,所以学习一下!MNIST 数据集已经是一个被”嚼烂”了的数据集, 很多教程都会对它”下手”, 几乎成为一个 “典范”. 不过有些人可能对它还不是很了解, 下面来介绍一下.MNIST 数据集可

2017-12-18 11:39:46 1936

转载 gbdt的参数意义与设置

http://www.jianshu.com/p/005a4e6ac775重要参数的意义及设置推荐GBDT树的深度:6;(横向比较:DecisionTree/RandomForest需要把树的深度调到15或更高)  以下摘自知乎上的一个问答(详见参考文献8),问题和回复都很好的阐述了这个参数设置的数学原理。  【问】xgboost/gbdt在调参时为什么树的深度很少就能达到很高的

2017-12-12 17:12:35 5647

原创 python中的3d画图

python的3d散点图from sklearn.cluster import KMeansfrom sklearn.externals import joblibfrom sklearn import clusterimport numpy as np # 生成10*3的矩阵data = np.random.rand(100,3)print data# 聚类为4类es

2017-12-12 16:39:48 1122

转载 snownlp和jieba对比,被碾压的很惨

今天逛网页,无意中看到了有人写snownlp这个库用来处理文本的情感,出于好奇,出于安慰吧(因为这两天想装hanlp,结果没装上,总是报错,心情巨沮丧!!,所以逛着其他包替代hanlp)发现jieba的分词直接碾压snownlp的分词,snownlp的情感分析也是巨慢,其中把训练中包括了分词部分,巨慢,不可用的赶脚!举例如下:更多的例子就不再一一列举了!不过还是把介

2017-12-12 16:20:51 56509 4

转载 jupyter notebook 安装,使用

http://blog.csdn.net/tina_ttl/article/details/51031113Python·Jupyter Notebook各种使用方法记录·持续更新使用pip来安装Jupyter。输入安装命令pip install jupyter即可,大约需要几十秒钟运行:cmd->jupyter notebook 在网页上运行一、 Ju

2017-12-11 17:28:17 10022

转载 交叉验证(CrossValidation)方法思想简介

交叉验证 Cross-validationhttps://www.cnblogs.com/sddai/p/5696834.html交叉验证(CrossValidation)方法思想简介以下简称交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为

2017-12-11 16:53:16 2087

转载 npp正则使用,很方便,就是需要会正则,正则一直是偶头疼的东东

http://blog.sina.com.cn/s/blog_62b13cf20102wtlw.html下载notepad++并安装。从该地址下载notepad++:http://download.tuxfamily.org/notepadplus/6.6/npp.6.6.Installer.exe。下载后安装软件。使用notepad++打开需要处理的文

2017-12-11 15:13:36 474

原创 那些年的风,那些年的雨,那些年一起走过的风风雨雨

这并非一篇洋洋洒洒的散文,这是一篇规规矩矩的数据分析         骨子里的自己其实是充满了浪漫色彩的文艺小清新,而现实眼中的自己却是一枚屌丝IT女!与那个同为屌丝IT人事的他一起携手走过了近4个年头了!生活中点点滴滴都在简单的时光里慢慢的沦为了回忆,成为了不可触及的过去,常常想让时光慢一些,让我们有时间来细细品味这点点滴滴,而时间的脚步却从未放慢一点点!能留住的似乎都在记忆的硬盘里!马上又

2017-12-09 16:38:14 409 2

转载 OneHotEncoder

one_hot(独热码)官方示例的个人理解官方给的例子1234567891011from sklearn import preprocessing enc = preprocessing.OneHotEncoder() 

2017-12-07 15:15:37 386

翻译 gbdt与逻辑回归融合

GBDT原理及利用GBDT构造新的特征-Python实现看了许多GBDT构建特征的资料整理而成,具体资料见Reference。背景Gradient BoostingGradient Boosting Decision TreeGBDT应用-回归和分类GBDT构建新的特征思想GBDT与LR融合方案源码内容generate GBD

2017-12-07 14:20:15 3795

转载 一个 11 行 Python 代码实现的神经网络

概要:直接上代码是最有效的学习方式。这篇教程通过由一段简短的 python 代码实现的非常简单的实例来讲解 BP 反向传播算法。代码如下:Python1234567891011X = np.array([ [0,0,1],[0,1,1],[1,0,1],[1,1,1] ]

2017-12-05 16:45:48 314

循序渐进教你学会EXT使用

1、ext表格控件; 2、ext树形; 3、表单和输入控件也能改成ext样式; 4、超脱一切的弹出窗口; 5、不同的浏览器可以显示一样的布局。。。

2011-09-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除