Apache中文网
片刻小哥哥
世界很美 而你正好有空
展开
-
scikit-learn sklearn 0.18 中文文档
ApacheCN(Apache中文网)- 关于我们 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813869ApacheCN cwiki 地址为 scikit-learn 0.18 中文文档 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=100301原创 2017-07-18 12:51:15 · 1343 阅读 · 0 评论 -
【机器学习实战】第1章 机器学习基础
第1章 机器学习基础机器学习 概述机器学习就是把无序的数据转换成有用的信息。获取海量的数据从海量数据中获取有用的信息我们会利用计算机来彰显数据背后的真实含义,这才是机器学习的意义。机器学习 场景例如:识别动物猫模式识别(官方标准):人们通过大量的经验,得到结论,从而判断它就是猫。机器学习(数据学习):人们通过阅读进行学习,观察它会叫、小眼睛、两只耳朵、四条腿、一条尾巴,得到结论,从而判断它就是原创 2017-04-24 17:54:00 · 1592 阅读 · 0 评论 -
【机器学习实战】第2章 K-近邻算法(k-NearestNeighbor,KNN)
第2章 k-近邻算法http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>KNN 概述k-近邻(kNN, k-NearestNeighbor)算法主要是用来进行分类的.KNN 场景电影可以按照题材分类,那么如何区分 动作片 和 爱情片 呢?动作片:打斗次数更原创 2017-04-24 22:54:44 · 2656 阅读 · 0 评论 -
【机器学习实战】第3章 决策树
第3章 决策树http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>决策树 概述决策树(Decision Tree)算法主要用来处理分类问题,是最经常使用的数据挖掘算法之一。决策树 场景一个叫做 "二十个问题" 的游戏,游戏的规则很简单:参与游戏的一方在脑海中想某个事物原创 2017-09-01 10:58:58 · 1453 阅读 · 0 评论 -
【机器学习实战】第4章 基于概率论的分类方法:朴素贝叶斯
第4章 基于概率论的分类方法:朴素贝叶斯http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>朴素贝叶斯 概述贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本章首先介绍贝叶斯分类算法的基础——贝叶斯定理。最后,我们通过实例来讨论贝叶斯分类的中最简单的一种原创 2017-09-03 23:47:33 · 876 阅读 · 0 评论 -
【机器学习实战】第5章 Logistic回归
第5章 Logistic回归http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>Logistic 回归 概述Logistic 回归虽然名字叫回归,但是它是用来做分类的。其主要思想是: 根据现有数据对分类边界线建立回归公式,以此进行分类。须知概念Sigmoid 函数回归原创 2017-10-09 10:41:25 · 794 阅读 · 0 评论 -
【机器学习实战】第6章 支持向量机
第6章 支持向量机http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>支持向量机 概述支持向量机(Support Vector Machines, SVM):是一种机器学习算法。支持向量(Support Vector)就是离分隔超平面最近的那些点。机(Machine)就是表示一种原创 2017-04-24 17:56:45 · 2556 阅读 · 0 评论 -
【机器学习实战】第7章 集成方法 ensemble method
第7章 集成方法 ensemble method集成方法: ensemble method(元算法: meta algorithm) 概述概念:是对其他算法进行组合的一种形式。通俗来说: 当做重要决定时,大家可能都会考虑吸取多个专家而不只是一个人的意见。 机器学习处理问题时又何尝不是如此? 这就是集成方法背后的思想。集成方法:投票选举(bag原创 2017-08-25 18:49:24 · 1305 阅读 · 0 评论 -
【机器学习实战】第8章 预测数值型数据:回归
第8章 预测数值型数据:回归http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>回归(Regression) 概述我们前边提到的分类的目标变量是标称型数据,而回归则是对连续型的数据做出处理,回归的目的是预测数值型数据的目标值。回归 场景回归的目的是预测数值型的目标值。原创 2017-10-09 10:45:55 · 1268 阅读 · 0 评论 -
【机器学习实战】第10章 K-Means(K-均值)聚类算法
第 10章K-Means(K-均值)聚类算法K-Means 算法聚类是一种无监督的学习, 它将相似的对象归到一个簇中, 将不相似对象归到不同簇中.相似这一概念取决于所选择的相似度计算方法.K-Means 是发现给定数据集的 K 个簇的聚类算法, 之所以称之为 K-均值 是因为它可以发现 K 个不同的簇, 且每个簇的中心采用簇中所含值的均值计算而成.簇个数 K原创 2017-09-19 10:27:01 · 1559 阅读 · 0 评论 -
【机器学习实战】第9章 树回归
第9章 树回归http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>树回归 概述我们本章介绍 CART(Classification And Regression Trees, 分类回归树) 的树构建算法。该算法既可以用于分类还可以用于回归。树回归 场景我们在第 8 章原创 2017-10-09 10:47:36 · 1204 阅读 · 0 评论 -
【机器学习实战】第12章 使用FP-growth算法来高效发现频繁项集
第12章 使用FP-growth算法来高效发现频繁项集前言在 第11章 时我们已经介绍了用 Apriori 算法发现 频繁项集 与 关联规则。本章将继续关注发现 频繁项集 这一任务,并使用 FP-growth 算法更有效的挖掘 频繁项集。FP-growth 算法简介一种非常好的发现频繁项集算法。基于Apriori算法构建,但是数据结构不同,使用叫做原创 2017-10-09 10:51:34 · 718 阅读 · 0 评论 -
【机器学习实战】第11章 使用 Apriori 算法进行关联分析
第 11 章 使用 Apriori 算法进行关联分析关联分析关联分析是一种在大规模数据集中寻找有趣关系的任务。 这些关系可以有两种形式:频繁项集(frequent item sets): 经常出现在一块的物品的集合。关联规则(associational rules): 暗示两种物品之间可能存在很强的关系。相关术语关联分析(关联规则学习): 从大规模数据集原创 2017-10-09 10:48:59 · 986 阅读 · 0 评论 -
【机器学习实战】第14章 利用SVD简化数据
第14章 利用SVD简化数据http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>SVD 概述奇异值分解(SVD, Singular Value Decomposition): 提取信息的一种方法,可以把 SVD 看成是从噪声数据中抽取相关特征。从生物信息学到金融学,SVD 是提取信息原创 2017-10-09 10:53:09 · 823 阅读 · 0 评论 -
【机器学习实战】第13章 利用 PCA 来简化数据
第13章 利用 PCA 来简化数据降维技术场景我们正通过电视观看体育比赛,在电视的显示器上有一个球。显示器大概包含了100万像素点,而球则可能是由较少的像素点组成,例如说一千个像素点。人们实时的将显示器上的百万像素转换成为一个三维图像,该图像就给出运动场上球的位置。在这个过程中,人们已经将百万像素点的数据,降至为三维。这个过程就称为降维(dimensionali原创 2017-09-19 10:31:02 · 1442 阅读 · 0 评论 -
【机器学习实战】第15章 大数据与MapReduce
第15章 大数据与MapReduce大数据 概述大数据: 收集到的数据已经远远超出了我们的处理能力。大数据 场景假如你为一家网络购物商店工作,很多用户访问该网站,其中有些人会购买商品,有些人则随意浏览后就离开。对于你来说,可能很想识别那些有购物意愿的用户。那么问题就来了,数据集可能会非常大,在单机上训练要运行好几天。接下来:我们讲讲 MapRede原创 2017-10-09 10:54:19 · 2153 阅读 · 3 评论 -
Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 | ApacheCN
Spark Streaming 编程指南概述一个入门示例基础概念依赖初始化 StreamingContextDiscretized Streams (DStreams)(离散化流)Input DStreams 和 Receivers(接收器)DStreams 上的 Transformations(转换)DStreams 上的输出操作翻译 2017-09-21 16:30:39 · 897 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - Spark 编程指南 | ApacheCN
Spark 编程指南概述Spark 依赖初始化 Spark使用 Shell弹性分布式数据集 (RDDs)并行集合外部 Datasets(数据集)RDD 操作基础传递 Functions(函数)给 Spark理解闭包示例Local(本地)vs. cluster(集群)模式打印 RDD 的 elemen翻译 2017-09-21 16:19:14 · 1272 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档
Apache Spark™ 是一个快速的, 用于海量数据处理的通用引擎.官方网址: http://spark.apache.org中文文档: http://spark.apachecn.org花了大概两周左右的时间,在原来 Spark 2.0.2 中文文档 版本的基础上,终于迭代出该 Spark 2.2.0 中文文档 的版本了。衷心感谢每一位参与者,感谢 ApacheC原创 2017-07-17 16:18:52 · 1479 阅读 · 0 评论 -
Apache Kudu 1.4.0 中文文档
ApacheCN cwiki 地址为 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813594已完成 80%,欢迎加入我们一起来完成翻译!~还差一点点就完工了,欢迎有想法的朋友,一起来维护迭代更新,另找找一位 kudu 的 admin,专门跟进这个事情,需要花的时间,稍微多一点点,有兴趣的联系我!!!原创 2017-07-13 11:08:47 · 1397 阅读 · 0 评论 -
Spark 2.0.2 中文文档 | 片刻 ApacheCN(Apache中文网)
ApacheCN(Apache中文网)- 关于我们 : http://www.apache.wiki/pages/viewpage.action?pageId=2887249ApacheCN(Apache中文网)- Apache Spark 2.0.2 中文文档 : http://www.apache.wiki/pages/viewpage.action?pageId=288361原创 2017-04-14 00:19:17 · 741 阅读 · 0 评论 -
Apache Storm 1.1.0 中文文档 | ApacheCN
前言 Apache Storm 是一个免费的,开源的,分布式的实时计算系统. 官方文档: http://storm.apache.org 中文文档: http://storm.apachecn.orgApacheCN 最近组织了翻译 Storm 1.1.0 中文文档 的活动,整体 翻译进度 为 96%. 感谢大家参与到该活动中来 感谢无私奉献的 贡献者,才有了这份 Storm 1.1.0原创 2017-08-28 18:23:34 · 684 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN
Spark SQL, DataFrames and Datasets GuideOverviewSQLDatasets and DataFrames开始入门起始点: SparkSession创建 DataFrames无类型的Dataset操作 (aka DataFrame 操作)Running SQL Queries Progra翻译 2017-09-25 10:57:09 · 851 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - GraphX Programming Guide | ApacheCN
GraphX Programming Guide概述入门属性 Graph示例属性 GraphGraph 运算符运算符的汇总表Property 运算符Structural 运算符Join 运算符邻域聚合聚合消息 (aggregateMessages)Map Reduce Triplets Transition G翻译 2017-09-26 12:33:19 · 519 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - SparkR (R on Spark) | ApacheCN
SparkR (R on Spark)概述SparkDataFrame启动: SparkSession从 RStudio 来启动创建 SparkDataFrames从本地的 data frames 来创建 SparkDataFrames从 Data Sources(数据源)创建 SparkDataFrame从 Hive tables翻译 2017-09-26 12:40:25 · 1254 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - 集群模式概述 | ApacheCN
集群模式概述该文档给出了 Spark 如何在集群上运行、使之更容易来理解所涉及到的组件的简短概述。通过阅读 应用提交指南 来学习关于在集群上启动应用。组件Spark 应用在集群上作为独立的进程组来运行,在您的 main 程序中通过 SparkContext 来协调(称之为 driver 程序)。具体的说,为了运行在集群上,SparkContext 可以连接至几种类型翻译 2017-09-27 17:32:15 · 677 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - Submitting Applications | ApacheCN
Submitting Applications在 script in Spark的 bin 目录中的spark-submit 脚本用与在集群上启动应用程序。它可以通过一个统一的接口使用所有 Spark 支持的 cluster managers,所以您不需要专门的为每个cluster managers配置您的应用程序。打包应用依赖如果您的代码依赖了其它的项目,为了分发翻译 2017-09-27 17:30:15 · 619 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN
Spark 概述Apache Spark 是一个快速的, 多用途的集群计算系统。 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎. 它还支持一组丰富的高级工具, 包括使用 SQL 处理结构化数据处理的 Spark SQL, 用于机器学习的 MLlib, 用于图形处理的 GraphX, 以及 Spark Strea翻译 2017-09-20 13:23:08 · 425 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN
快速入门使用 Spark Shell 进行交互式分析基础Dataset 上的更多操作缓存独立的应用快速跳转本教程提供了如何使用 Spark 的快速入门介绍。首先通过运行 Spark 交互式的 shell(在 Python 或 Scala 中)来介绍 API, 然后展示如何使用 Java , Scala 和 Python 来编写应用程序。为翻译 2017-09-20 13:29:47 · 496 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - Spark RDD(Resilient Distributed Datasets)论文 | ApacheCN
Spark RDD(Resilient Distributed Datasets)论文概要1: 介绍2: Resilient Distributed Datasets(RDDs)2.1 RDD 抽象2.2 Spark 编程接口2.2.1 例子 – 监控日志数据挖掘2.3 RDD 模型的优势2.4 不适合用 RDDs 的应用3翻译 2017-09-20 20:59:45 · 1228 阅读 · 0 评论 -
scikit-learn(sklearn) 0.19 中文文档的翻译计划,邀请你的加入 | ApacheCN
scikit-learn(sklearn)官方地址: http://scikit-learn.org/ * 简单高效的数据挖掘和数据分析工具 * 可供大家使用,可在各种环境中重复使用 * 建立在 NumPy,SciPy 和 matplotlib 上 * 开放源码,可商业使用 - BSD license关于我们我们是 ApacheCN 开源组织,一群有想法,爱装逼,爱原创 2017-09-29 17:17:45 · 532 阅读 · 0 评论 -
【机器学习实战】Machine Learning in Action 代码 视频 项目案例
MachineLearning欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远ApacheCN - 学习机器学习群【629470233】Machine Learning in Action (机器学习实战) | ApacheCN(apache中文网)电子版书籍:【机器学习实战-中文版-带目录版.pdf】视频每周更新:如果你觉得有价值,请帮忙点 Star【后续组原创 2017-06-12 19:03:19 · 4919 阅读 · 2 评论