自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (9)
  • 问答 (1)
  • 收藏
  • 关注

翻译 [Spark2.0]ML 调优:模型选择和超参数调优

本节讲述如何使用MLlib提供的工具来对ML算法和Pipline进行调优。内建的交叉验证和其他工具允许用户在算法和Pipline中优化超参数。     模型选择(又名 超参数调优)         在ML中一个重要的任务就是模型选择,或者使用给定的数据为给定的任务寻找最适合的模型或参数。这也叫做 调优。调优可以是对单个的Estimator,比如LogisticRegression,或

2016-08-20 01:13:08 7147

翻译 [Spark2.0]ML piplines管道模式

在本部分,我们将介绍ML Pipline的概念。ML Pipline提供了一整套建立在DataFrame上的高级API,它能帮助用户创建和调优实际机器学习管道。 Pipline的主要思想        Mllib标准化了机器学习算法的API,使得将多个算法融合到一个简单的管道或工作流更为简单。本部分将覆盖Pipline API的关键思想,这里的pipline概念是受scikit

2016-08-17 23:26:57 3945

翻译 [Spark2.0]Spark SQL, DataFrames 和Datasets指南

综述         Spark SQL是Spark提供的针对结构化数据处理的模块。不同于基本的Spark RDD API,SparkSQL提供的接口提供了更多的关于数据和计算执行的信息。在内部,SparkSQL使用这些额外信息完成额外的优化。这里有几种方式可以和SparkSQL相互操作,包括SQL和Dataset API。计算结果的时候使用相同的执行          本页中所有示例使

2016-08-16 00:00:28 7435

2015中国互联网金融趋势报告

智酷2015互联网金融趋势报告,新鲜出炉,71页完整版

2015-11-10

SBT-0.13.8 for windows

sbt-0.13.8最新版本, 由于官网下载比较困难,在此贡献给大家

2015-06-10

Cassandra使用手册

cassandra数据库安装、数据模型、常用命令、thrift接口、cassandra测试以及cassandra在线交易系统实例

2015-01-22

HBase实战(中文扫描版)

HBase实战(中文扫描版).pdf 完整版,学习hadoop体系必备

2014-12-09

hadoop-eclipse-plugin-1.2.1插件

luna编译的hadoop-eclipse-plugin-1.2.1插件

2014-12-09

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除