自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(148)
  • 收藏
  • 关注

转载 【scikit-learn 0.19 中文文档 】安装 scikit-learn | ApacheCN

中文文档:http://sklearn.apachecn.org/cn/0.19.0/tutorial/basic/tutorial.html 英文文档:http://sklearn.apachecn.org/en/0.19.0/tutorial/basic/tutorial.html ...

2017-11-21 12:57:00 194

转载 【机器学习实战】第15章 大数据与 MapReduce

第15章 大数据与MapReduce 大数据 概述 大数据: 收集到的数据已经远远超出了我们的处理能力。 大数据 场景 假如你为一家网络购物商店工作,很多用户访问该网站,其中�有些人会购买商品,有些人则随意浏览后就离开。对于你来说,可能很想识别那些有购物意愿的用户。那么问...

2017-10-09 14:04:00 300

转载 【机器学习实战】第14章 利用 SVD 简化数据

第14章 利用SVD简化数据 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default"></script> SVD...

2017-10-09 14:01:00 307

转载 【机器学习实战】第13章 利用 PCA 来简化数据

第13章 利用 PCA 来简化数据 降维技术 场景 我们正通过电视观看体育比赛,在电视的显示器上有一个球。 显示器大概包含了100万像素点,而球则可能是由较少的像素点组成,例如说一千个像素点。 人们实时的将显示器上的百万像素转换成为一个三维图像,该图像就给...

2017-10-09 13:50:00 312

转载 【机器学习实战】第12章 使用FP-growth 算法来高效发现频繁项集

第12章 使用FP-growth算法来高效发现频繁项集 前言 在第11章时我们已经介绍了用Apriori算法发现频繁项集与关联规则。 本章将继续关注发现频繁项集这一任务,并使用FP-growth算法更有效的挖掘频繁项集。 FP-growth 算法简介 ...

2017-10-09 13:42:00 143

转载 【机器学习实战】第11章 使用 Apriori 算法进行关联分析

第 11 章 使用 Apriori 算法进行关联分析 关联分析 关联分析是一种在大规模数据集中寻找有趣关系的任务。 这些关系可以有两种形式: 频繁项集(frequent item sets): 经常出现在一块的物品的集合。 关联规则(associational rule...

2017-10-09 13:27:00 260

转载 【机器学习实战】第9章 树回归(Tree Regression)

第9章 树回归 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default"></script> 树回归 概述 我们...

2017-10-09 13:21:00 245

转载 【机器学习实战】第8章 预测数值型数据:回归(Regression)

第8章 预测数值型数据:回归 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default"></script> 回归(...

2017-10-09 13:18:00 382

转载 【机器学习实战】第6章 支持向量机(Support Vector Machine / SVM)

第6章 支持向量机 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default"></script> 支持向量机 概述...

2017-10-09 13:14:00 222

转载 【机器学习实战】第5章 Logistic回归(逻辑回归)

第5章 Logistic回归 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default"></script> Log...

2017-10-09 13:08:00 265

转载 Apache Spark 2.2.0 中文文档 - SparkR (R on Spark) | ApacheCN

SparkR (R on Spark) 概述 SparkDataFrame 启动: SparkSession 从 RStudio 来启动 创建 SparkDataFrames 从本地的 data frames 来创建 Spa...

2017-09-26 17:04:00 114

转载 Apache Spark 2.2.0 中文文档 - GraphX Programming Guide | ApacheCN

GraphX Programming Guide 概述 入门 属性 Graph 示例属性 Graph Graph 运算符 运算符的汇总表 Property 运算符 Structural 运算符 Join 运...

2017-09-26 17:01:00 127

转载 Apache Spark 2.2.0 中文文档 - Structured Streaming 编程指南 | ApacheCN

Structured Streaming 编程指南 概述 快速示例 Programming Model (编程模型) 基本概念 处理 Event-time 和延迟数据 容错语义 API 使用 Datasets 和 DataFram...

2017-09-26 16:57:00 169

转载 Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN

Spark SQL, DataFrames and Datasets Guide Overview SQL Datasets and DataFrames 开始入门 起始点: SparkSession 创建 DataFra...

2017-09-26 16:53:00 202

转载 Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 | ApacheCN

Spark Streaming 编程指南 概述 一个入门示例 基础概念 依赖 初始化 StreamingContext Discretized Streams (DStreams)(离散化流) Input DStreams 和 Rece...

2017-09-26 16:36:00 110

转载 Apache Spark 2.2.0 中文文档 - Spark 编程指南 | ApacheCN

Spark 编程指南 概述 Spark 依赖 初始化 Spark 使用 Shell 弹性分布式数据集 (RDDs) 并行集合 外部 Datasets(数据集) RDD 操作 基础 ...

2017-09-26 16:32:00 98

转载 Spark RDD(Resilient Distributed Datasets)论文 | ApacheCN

Spark RDD(Resilient Distributed Datasets)论文 概要 1: 介绍 2: Resilient Distributed Datasets(RDDs) 2.1 RDD 抽象 2.2 Spark 编程接口 ...

2017-09-21 16:34:00 176

转载 Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN

快速入门 使用 Spark Shell 进行交互式分析 基础 Dataset 上的更多操作 缓存 独立的应用 快速跳转 本教程提供了如何使用 Spark 的快速入门介绍。首先通过运行 Spark 交互式的 shell(在 Pyt...

2017-09-20 14:15:00 98

转载 Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN

Spark 概述 Apache Spark 是一个快速的, 多用途的集群计算系统。 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎. 它还支持一组丰富的高级工具, 包括使用 SQL 处理结构化数据处理的Spark SQ...

2017-09-20 14:12:00 79

转载 【机器学习实战】第10章 K-Means(K-均值)聚类算法

第 10 章 K-Means(K-均值)聚类算法 K-Means 算法 聚类是一种无监督的学习, 它将相似的对象归到一个簇中, 将不相似对象归到不同簇中. 相似这一概念取决于所选择的相似度计算方法. K-Means 是发现给定数据集的 K 个簇的聚类算法, 之所以称之为K-均值...

2017-09-12 18:02:00 330

转载 【机器学习实战】第4章 朴素贝叶斯

第4章 基于概率论的分类方法:朴素贝叶斯 朴素贝叶斯 概述 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本章首先介绍贝叶斯分类算法的基础——贝叶斯定理。最后,我们通过实例来讨论贝叶斯分类的中最简单的一种: 朴素贝叶斯分类。 贝叶斯理论 &a...

2017-09-03 23:06:00 133

转载 【机器学习实战】第7章 集成方法(ensemble method)

第7章 集成方法 ensemble method 集成方法: ensemble method(元算法: meta algorithm) 概述 概念:是对其他算法进行组合的一种形式。 通俗来说: 当做重要决定时,大家可能都会考虑吸取多个专家而不只是一个人的意见。 机器...

2017-09-01 11:52:00 241

转载 【机器学习实战】第3章 决策树(Decision Tree)

第3章 决策树 决策树 概述 决策树(Decision Tree)算法主要用来处理分类问题,是最经常使用的数据挖掘算法之一。 决策树 场景 一个叫做 "二十个问题" 的游戏,游戏的规则很简单:参与游戏的一方在脑海中想某个事物,其他参与者向他提问,只允许提 20 个问题,问题的...

2017-09-01 11:40:00 248

转载 【机器学习实战】第2章 k-近邻算法(kNN)

第2章 k-近邻算法 KNN 概述 k-近邻(kNN, k-NearestNeighbor)算法主要是用来进行分类的. KNN 场景 电影可以按照题材分类,那么如何区分动作片和爱情片呢? 动作片:打斗次数更多 爱情片:亲吻次数更多 基于电影中的亲吻、...

2017-09-01 11:36:00 231

转载 【机器学习实战】第1章 机器学习基础

第1章 机器学习基础 机器学习 概述 机器学习就是把无序的数据转换成有用的信息。 获取海量的数据 从海量数据中获取有用的信息 我们会利用计算机来彰显数据背后的真实含义,这才是机器学习的意义。 机器学习 场景 例如:识别动物猫模式识别(官方标准):人们通过大...

2017-09-01 11:21:00 63

转载 Apache Storm 1.1.0 中文文档 | ApacheCN

前言Apache Storm 是一个免费的,开源的,分布式的实时计算系统.官方文档: http://storm.apache.org中文文档: http://storm.apachecn.orgApacheCN 最近组织了翻译 Storm 1.1.0 中文文档 的活动,整体 翻译进度...

2017-08-28 18:28:00 54

转载 scikit-learn sklearn 0.18 官方文档中文版 | ApacheCN

ApacheCN(Apache中文网)- 关于我们:http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813869 ApacheCN cwiki 地址为scikit-learn 0.18 中文文档:http://cwi...

2017-07-18 13:25:00 86

转载 Apache Spark 2.2.0 中文文档迭代翻译活动,期待您的参与 | ApacheCN

Spark 2.2.0已然发布(2017-07-11发布)5天了,更新了一些新套路吧! 此版本从StructuredStreaming(结构化流)中删除experimental(实验)标记。 此外,此版本更多地侧重于usability(可用性),stability...

2017-07-17 16:23:00 45

转载 Apache Kudu 1.4.0 中文文档 | 小瑶 - ApacheCN

原文地址 :http://www.apachecn.org/bigdata/kudu/36.html ApacheCN cwiki 地址为 :http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813594 ApacheCN...

2017-07-13 11:58:00 96

转载 Apache Zeppelin 0.7.2 中文文档

ApacheCN(Apache中文网)- 关于我们:http://www.apache.wiki/pages/viewpage.action?pageId=10030937 ApacheCN(Apache中文网)- Apache Zeppelin 0.7.2中文文档:http://...

2017-06-15 14:10:00 126

转载 TensorFlow R1.2 中文文档

ApacheCN(Apache中文网)- 关于我们:http://www.apache.wiki/pages/viewpage.action?pageId=10030117 ApacheCN(Apache中文网)- TensorFlow R1.2 中文文档:http://www.apa...

2017-06-12 20:15:00 141

转载 Machine Learning in Action (python) | ApacheCN(apache中文网)

MachineLearning Machine Learning in Action (python) |ApacheCN(apache中文网) github地址:https://github.com/apachecn/MachineLearning 第一部分 分类 ...

2017-04-11 14:40:00 85

转载 ApacheCN

2016年10月1日到现在,ApacheCN成立了快5个月了,欢迎大家来一起装逼,一起学习。 装逼请选择:www.apache.wiki 转载于:https://my.oschina.n...

2017-02-20 10:10:00 79

转载 StringUtils.java解析2

/** * public boolean equals(Object anObject) { * if (this == anObject) { * return true; * } * if (anObject in...

2016-08-04 22:31:00 84

转载 StringUtils.java解析【持续更新】

StringUtils工具类在org.apache.commons.lang.StringUtils包下,下面我将在源码的基础上做笔记一样一点一点读下去,解析下去。 package org.apache.commons.lang; import java.util.*; // Refer...

2016-07-25 08:47:00 75

转载 Git常识以及Git常用命令

一、Git常识 1.工作区(Working Directory) 工作区就是我们能够在电脑中看到的目录,比如我在D盘中创建的一个study文件夹,然后使用 git init 命令完成创建版本库的操作。 这个study文件夹就是一个工作区。 2.版本库(Repository) 版本...

2016-07-20 13:35:00 82

转载 Git pull时出错

在使用Git pull命令将远程代码拉取到本地的时候,出现错误,无法拉取。错误如下: Pull is not possible because you have unmerged files.Please, fix them up in the work tree, and then us...

2016-07-18 19:23:00 218

转载 length,length(),size()之间的区别

前几天,有个朋友要入职,跟他一起做Java相关的笔试题,期间遇到了,数组的长度的表达问题。当时突然间就忘了,现在记下来,以备不时之需。 1、java中的length属性是针对数组说的。 比如说你声明了一个数组,想知道这个数组的长度则用到了length这个属性。 2、java中的lengt...

2016-07-12 13:15:00 89

转载 Git push出错

前段时间都是自己一个人在一个Git分支上进行开发,没有发现这样的情况。 前几天本地开发完成之后,Git push到远程的分支的时候,出现了如下的错误(当时没来得及截图,图片是网上的,但是出现的问题是一样的^_^,抱歉哈): 错误原因: 出现这种错误的原因是:多人同时将一个版本(分支)...

2016-07-03 16:43:00 78

转载 SAS创建宏变量的七种方法

学会创建宏变量,特别是全局宏变量是应用宏的一个基础,下面我们介绍一下,创建宏变量的七种方法,并通过例子来演示。 1.通过宏函数创建宏变量。 %let dsid=%sysfunc(open(sashelp.class));%let nvars=%sysfunc(attrn(&...

2016-03-01 10:01:00 5881

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除