自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

yhao2014的专栏

09月 08月 06月 05月 04月 03月 02月

翻译 [Spark2.0]ML 调优：模型选择和超参数调优

本节讲述如何使用MLlib提供的工具来对ML算法和Pipline进行调优。内建的交叉验证和其他工具允许用户在算法和Pipline中优化超参数。模型选择（又名超参数调优）在ML中一个重要的任务就是模型选择，或者使用给定的数据为给定的任务寻找最适合的模型或参数。这也叫做调优。调优可以是对单个的Estimator，比如LogisticRegression，或

2016-08-20 01:13:08 7147

翻译 [Spark2.0]ML piplines管道模式

在本部分，我们将介绍ML Pipline的概念。ML Pipline提供了一整套建立在DataFrame上的高级API，它能帮助用户创建和调优实际机器学习管道。 Pipline的主要思想 Mllib标准化了机器学习算法的API，使得将多个算法融合到一个简单的管道或工作流更为简单。本部分将覆盖Pipline API的关键思想，这里的pipline概念是受scikit

2016-08-17 23:26:57 3945

翻译 [Spark2.0]Spark SQL, DataFrames 和Datasets指南

综述 Spark SQL是Spark提供的针对结构化数据处理的模块。不同于基本的Spark RDD API，SparkSQL提供的接口提供了更多的关于数据和计算执行的信息。在内部，SparkSQL使用这些额外信息完成额外的优化。这里有几种方式可以和SparkSQL相互操作，包括SQL和Dataset API。计算结果的时候使用相同的执行本页中所有示例使

2016-08-16 00:00:28 7435

2015中国互联网金融趋势报告

智酷2015互联网金融趋势报告，新鲜出炉，71页完整版

2015-11-10

SBT-0.13.8 for windows

sbt-0.13.8最新版本, 由于官网下载比较困难，在此贡献给大家

2015-06-10

Cassandra使用手册

cassandra数据库安装、数据模型、常用命令、thrift接口、cassandra测试以及cassandra在线交易系统实例

2015-01-22

HBase实战（中文扫描版）

HBase实战(中文扫描版).pdf 完整版，学习hadoop体系必备

2014-12-09

hadoop-eclipse-plugin-1.2.1插件

luna编译的hadoop-eclipse-plugin-1.2.1插件

2014-12-09

从logstash向elasticsearch导入数据出错

2015-06-19

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

yhao浩 CSDN认证博客专家 CSDN认证企业博客

码龄10年

IP 属地：广东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

41: 原创

13万+: 周排名

148万+: 总排名

62万+: 访问

: 等级

3681: 积分

162: 粉丝

279: 获赞

134: 评论

837: 收藏

私信

关注

热门文章

分类专栏

机器学习 4篇
spark 12篇
Hadoop 6篇
Hive 4篇
java 5篇
数据库 1篇
系统运维 10篇
Hadoop FAQ 4篇
Scala特性 5篇
Spark FAQ 1篇
数据挖掘算法 2篇

最新评论

Hadoop退出安全模式
神鹰_: 为什么不能退出安全模式，没有这条命令
Linux格式化并重新加载磁盘
jaafarckk: 怎么就我背啊，任何修改u盘操作都是卡着然后device not found。为什么说背呢--2个U盘
梯度下降法及其Python实现
梧桐elle: 迭代次数是2608，请问有大佬知道是什么原因吗
梯度下降法及其Python实现
梧桐elle: 请问解决了吗，我也是2608
梯度下降法及其Python实现
qq_46342891: 我认为原始数据是两维的，x第一个系数全是1

最新文章

提示

确定要删除当前文章？

取消删除