- 博客(10)
- 资源 (12)
- 收藏
- 关注
转载 GBDT算法简介
在网上看到一篇GBDT介绍非常好的文章,GBDT大概是非常好用又非常好用的算法之一了吧(哈哈 两个好的意思不一样) GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答
2017-02-28 15:07:06 2150
转载 Random Forest算法中的参数详解
本篇不是介绍RF的,关于RF网上有很多通俗易懂的解释西瓜书与统计学习方法等很多教材中的解释也都足够本篇仅针对如何使用sklearn中的RandomForestClassifier作记录一、代码怎么写[python] view plain copy print?class sklearn.ensemble.RandomForestC
2017-02-28 14:46:05 6292 2
转载 集成学习之参数调整策略
1 Random Forest和Gradient Tree Boosting参数详解 在sklearn.ensemble库中,我们可以找到Random Forest分类和回归的实现:RandomForestClassifier和RandomForestRegression,Gradient Tree Boosting分类和回归的实现:GradientBoostingClassifier和
2017-02-28 14:34:42 2864
转载 sklearn中常用的数据预处理方法
常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1. 标准化(Standardization or Mean Removal and Variance Scaling)变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去均值,除以标准差。1sklearn.prepro
2017-02-28 14:21:13 1088
转载 初学大数据之Python中5个最佳的数据科学库的学习
在下载了pycharm软件以及通过前两篇文章,配置了相应的模块包之后,那就开始对常用的模块的学习,以便后期利用这些模块对数据做模型化处理。 如果你已经决定把Python作为你的编程语言,那么,你脑海中的下一个问题会是:“进行数据分析有哪些Python库可用?”Python有很多库可用来进行数据分析。但不必担心,你不需要学习所有那些可用库。你只须了解5个Python库,就可以完成绝大多数...
2017-02-24 11:39:10 8162
原创 初学大数据之模块集成:Pycharm安装numpy,scipy,sklearn等包时遇到的各种问题的一键解决方法
最近在学习机器学习,要用Python写程序,习惯了用IDE软件,所以就使用Pycharm软件。但是在导入类似numpy,sklearn等模块的时候,发现了各种问题(如Python版本与模块之间的兼容等各类问题),上网找了许多方法,最后总算总结出了这条最快捷的方法,那就是使用Anaconda这个软件。 通过在pycharm中导入Anaconda内部的集成模块库(将类似与numpy,scipy等模块...
2017-02-23 21:42:05 50964 15
原创 初学大数据之Pycharm常用的快捷键总结
pycharm快捷键及一些常用设置,有需要的朋友可以参考下。加粗的都是个人认为比较常用的快捷键 Alt+Enter 自动添加包 Ctrl+t SVN更新 Ctrl+k SVN提交 Ctrl + / 注释(取消注释)选择的行 Ctrl+Shift+F 高级查找 Ctrl+Enter 补全 Shift + Enter 开始新行 TAB Shift+TAB 缩进/取消缩进所选择的行 ...
2017-02-18 19:53:53 744 1
原创 Vim的基本操作总结
最近在学习Linux基础的时候,对Vim的基本操作时遇到很多问题,如编辑错误,无法退出Vim等。通过一系列的学习后才解决了这些问题,希望这个过程能对后来者有所帮助 先对Vim的三种模式做个大致的介绍: Vi有三种基本工作模式: + 命令模式 + 文本输入模式 + 末行模式。 三种模式之间的关系如下: 1.1输入vi 指令 进入指定的文件进行编辑 如下图所示: 1.2 若指定文件已
2017-02-15 19:37:29 492
转载 linux su切换用户提示Authentication failture的解决办法
由于ubtun系统默认是没有激活root用户的,需要我们手工进行操作,在命令行界面下,或者在终端中输入如下命令: sudo passwd Password:你当前的密码 Enter new UNIX password:这个是root的密码 Retype new UNIX password:重复root的密码 然后会提示成功的信息。 在说明一点,使用su和sudo是有
2017-02-14 14:37:31 1986
转载 大数据入门:各种大数据技术的介绍
大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来。为了能够更好的架构大数据项目,这里整理一下,供技术人员,项目经理,架构师选择合适的技术,了解大数据各种技术之间的关系,选择合适的语言。我们可以带着下面问题来阅读本文章:1.hadoop都包含什么技术2.Cloudera公司与hadoop的关系是什么,都有什么产品
2017-02-11 17:14:20 526
中国计算机学会推荐各种国际学术会议和期刊目录
2018-06-01
Linux命令大全.chm版下载
2017-10-21
mysql-connector-java-5.1.32.jar
2017-10-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人