自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (12)
  • 收藏
  • 关注

转载 GBDT算法简介

在网上看到一篇GBDT介绍非常好的文章,GBDT大概是非常好用又非常好用的算法之一了吧(哈哈 两个好的意思不一样)              GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答

2017-02-28 15:07:06 2150

转载 Random Forest算法中的参数详解

本篇不是介绍RF的,关于RF网上有很多通俗易懂的解释西瓜书与统计学习方法等很多教材中的解释也都足够本篇仅针对如何使用sklearn中的RandomForestClassifier作记录一、代码怎么写[python] view plain copy print?class sklearn.ensemble.RandomForestC

2017-02-28 14:46:05 6292 2

转载 集成学习之参数调整策略

1 Random Forest和Gradient Tree Boosting参数详解  在sklearn.ensemble库中,我们可以找到Random Forest分类和回归的实现:RandomForestClassifier和RandomForestRegression,Gradient Tree Boosting分类和回归的实现:GradientBoostingClassifier和

2017-02-28 14:34:42 2864

转载 sklearn中常用的数据预处理方法

常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1. 标准化(Standardization or Mean Removal and Variance Scaling)变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去均值,除以标准差。1sklearn.prepro

2017-02-28 14:21:13 1088

转载 初学大数据之Python中5个最佳的数据科学库的学习

在下载了pycharm软件以及通过前两篇文章,配置了相应的模块包之后,那就开始对常用的模块的学习,以便后期利用这些模块对数据做模型化处理。 如果你已经决定把Python作为你的编程语言,那么,你脑海中的下一个问题会是:“进行数据分析有哪些Python库可用?”Python有很多库可用来进行数据分析。但不必担心,你不需要学习所有那些可用库。你只须了解5个Python库,就可以完成绝大多数...

2017-02-24 11:39:10 8162

原创 初学大数据之模块集成:Pycharm安装numpy,scipy,sklearn等包时遇到的各种问题的一键解决方法

最近在学习机器学习,要用Python写程序,习惯了用IDE软件,所以就使用Pycharm软件。但是在导入类似numpy,sklearn等模块的时候,发现了各种问题(如Python版本与模块之间的兼容等各类问题),上网找了许多方法,最后总算总结出了这条最快捷的方法,那就是使用Anaconda这个软件。 通过在pycharm中导入Anaconda内部的集成模块库(将类似与numpy,scipy等模块...

2017-02-23 21:42:05 50964 15

原创 初学大数据之Pycharm常用的快捷键总结

pycharm快捷键及一些常用设置,有需要的朋友可以参考下。加粗的都是个人认为比较常用的快捷键 Alt+Enter 自动添加包 Ctrl+t SVN更新 Ctrl+k SVN提交 Ctrl + / 注释(取消注释)选择的行 Ctrl+Shift+F 高级查找 Ctrl+Enter 补全 Shift + Enter 开始新行 TAB Shift+TAB 缩进/取消缩进所选择的行 ...

2017-02-18 19:53:53 744 1

原创 Vim的基本操作总结

最近在学习Linux基础的时候,对Vim的基本操作时遇到很多问题,如编辑错误,无法退出Vim等。通过一系列的学习后才解决了这些问题,希望这个过程能对后来者有所帮助 先对Vim的三种模式做个大致的介绍: Vi有三种基本工作模式: + 命令模式 + 文本输入模式 + 末行模式。 三种模式之间的关系如下: 1.1输入vi 指令 进入指定的文件进行编辑 如下图所示: 1.2 若指定文件已

2017-02-15 19:37:29 492

转载 linux su切换用户提示Authentication failture的解决办法

由于ubtun系统默认是没有激活root用户的,需要我们手工进行操作,在命令行界面下,或者在终端中输入如下命令: sudo passwd Password:你当前的密码 Enter new UNIX password:这个是root的密码 Retype new UNIX password:重复root的密码 然后会提示成功的信息。   在说明一点,使用su和sudo是有

2017-02-14 14:37:31 1986

转载 大数据入门:各种大数据技术的介绍

大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来。为了能够更好的架构大数据项目,这里整理一下,供技术人员,项目经理,架构师选择合适的技术,了解大数据各种技术之间的关系,选择合适的语言。我们可以带着下面问题来阅读本文章:1.hadoop都包含什么技术2.Cloudera公司与hadoop的关系是什么,都有什么产品

2017-02-11 17:14:20 526

中国计算机学会推荐各种国际学术会议和期刊目录

中国计算机学会推荐各种国际学术会议和期刊目录包含主要罗列了国际上计算机相关的各个方向的顶级学术会议和期刊目录(包含A、B、C三个等级)。 包含的方向有: 计算机体系结构/并行与分布计算/存储系统 计算机网络 网络与信息安全 软件工程/系统软件/程序设计语言 数据库/数据挖掘/内容检索 计算机科学理论 计算机图形学与多媒体 人工智能 人机交互与普适计算 交叉/综合/新兴

2018-06-01

Linux命令大全.chm版下载

Linux离线手册,内部包含汉化的Linux命令格式及详细解释 Linux命令大全(修改版) 文件传输 备份压缩 文件管理 磁盘管理 磁盘维护 系统设置 系统管理 文档编辑 网络通讯 bye 功能说明:中断FTP连线并结束程序。 语  法:bye 补充说明:在ftp模式下,输入bye即可中断目前的连线作业,并结束ftp的执行。 ftpcount 功能说明:显示目前以FTP登入的用户人数。 语  法:ftpcount 补充说明:执行这项指令可得 知目前用FTP登入系统的人数以及FTP登入人数的上限。

2017-10-21

staruml-5.0

uml建模工具,常用于构建各种UML模型。简单快捷,欢迎使用

2017-10-19

mysql-connector-java-5.1.32.jar

hive安装。本地独立模式:在本地安装Mysql,元数据放到mySql内。支持hive数据方放入mysql的jar包

2017-10-18

hive-0.9.0

hive的低版本,适用于hadoop2.x版本,防止安装过程发生各种错误

2017-10-18

startuml中文版

startuml中文版敖德萨多adad阿斯蒂芬烦死哒更改阿道夫个电饭锅电饭锅十多个十多个但是合适的防守打法安抚发的萨芬

2017-09-27

工具Tomcat

一个简单的工具用于大数据中在网页上查看HDFS等资源,这时linux系统常用的软件之一,其他的软件会接着上传。

2017-09-18

钱能C++程序设计教程第二版课后答案

找了很久才找到的课后答案,属于稀缺资源

2017-02-21

二维码相关功能实现的类库

一个关于二维码扫描和二维码名片生成功能实现的类库,可引入工程中 实现配合我之前的文章,实现上述功能的实现

2016-10-19

微信图标大全包含APP中各种图标

APP中的各种图标,便于前端小伙伴直接获取图标。

2016-09-11

开源天气预报软件

开源天气预报软件

2016-08-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除