200_Alink漫谈
Alink是阿里巴巴基于实时计算引擎Flink研发的新一代机器学习算法平台,本专栏将从源码分析和应用场景角度入手,带领大家深入剖析Alink。
罗西的思考
这个作者很懒,什么都没留下…
展开
-
Alink漫谈(二十二) :源码分析之聚类评估
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和上文将带领大家来分析Alink中 聚类评估 的实现。原创 2020-09-26 08:37:48 · 1123 阅读 · 0 评论 -
Alink漫谈(二十一) :回归评估之源码分析
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和将带领大家来分析Alink中 回归评估 的实现。原创 2020-09-25 23:31:03 · 323 阅读 · 0 评论 -
Alink漫谈(二十) :卡方检验源码解析
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将带领大家来分析 Alink 中 卡方检验 的实现。原创 2020-08-29 07:28:04 · 357 阅读 · 0 评论 -
Alink漫谈(十九) :源码解析 之 分位点离散化Quantile
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将带领大家来分析Alink中 Quantile 的实现。原创 2020-08-19 21:12:56 · 427 阅读 · 0 评论 -
Alink漫谈(十八) :源码解析 之 多列字符串编码MultiStringIndexer
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将带领大家来分析Alink中 MultiStringIndexer 的实现。原创 2020-08-15 07:55:20 · 239 阅读 · 0 评论 -
Alink漫谈(十七) :Word2Vec源码分析 之 迭代训练
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和上文将带领大家来分析Alink中 Word2Vec 的实现。原创 2020-08-08 09:44:26 · 266 阅读 · 0 评论 -
Alink漫谈(十六) :Word2Vec源码分析 之 建立霍夫曼树
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式、流式算法的机器学习平台。本文和下文将带领大家来分析Alink中 Word2Vec 的实现。原创 2020-08-03 18:15:35 · 372 阅读 · 0 评论 -
Alink漫谈(十五) :多层感知机 之 迭代优化
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和前文将带领大家来分析Alink中多层感知机的实现。原创 2020-07-29 20:53:01 · 403 阅读 · 0 评论 -
Alink漫谈(十四) :多层感知机 之 总体架构
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和下文将带领大家来分析Alink中多层感知机的实现。原创 2020-07-26 18:10:23 · 459 阅读 · 1 评论 -
Alink漫谈(十三) :在线学习算法FTRL 之 具体实现
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和上文一起介绍了在线学习算法 FTRL 在Alink中是如何实现的,希望对大家有所帮助。原创 2020-07-22 21:10:05 · 668 阅读 · 1 评论 -
Alink漫谈(十二) :在线学习算法FTRL 之 整体设计
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和下文将介绍在线学习算法FTRL在Alink中是如何实现的,希望对大家有所帮助。原创 2020-07-16 21:50:42 · 506 阅读 · 0 评论 -
Alink漫谈(十一) :线性回归 之 L-BFGS优化
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文介绍了线性回归的L-BFGS优化在Alink是如何实现的,希望可以作为大家看线性回归代码的Roadmap。原创 2020-07-12 20:34:47 · 1011 阅读 · 0 评论 -
Alink漫谈(十) :线性回归实现 之 数据预处理
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和下文将介绍线性回归在Alink中是如何实现的,希望可以作为大家看线性回归代码的Roadmap。原创 2020-07-11 08:21:20 · 761 阅读 · 2 评论 -
Alink漫谈(九) :特征工程 之 特征哈希/标准化缩放
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将剖析Alink “特征工程” 部分对应代码实现。原创 2020-07-04 06:46:35 · 575 阅读 · 0 评论 -
Alink漫谈(八) : 二分类评估 AUC、K-S、PRC、Precision、Recall、LiftChart 如何实现
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。二分类评估是对二分类算法的预测结果进行效果评估。本文将剖析Alink中对应代码实现。原创 2020-06-26 10:37:59 · 558 阅读 · 0 评论 -
Alink漫谈(七) : 如何划分训练数据集和测试数据集
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将为大家展现Alink如何划分训练数据集和测试数据集。原创 2020-06-12 22:48:06 · 1834 阅读 · 0 评论 -
Alink漫谈(六) : TF-IDF算法的实现
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。本文将为大家展现Alink如何实现TF-IDF。原创 2020-06-05 21:56:46 · 560 阅读 · 0 评论 -
Alink漫谈(五) : 迭代计算和Superstep
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。迭代算法在很多数据分析领域会用到,比如机器学习或者图计算。本文将通过Superstep入手看看Alink是如何利用Flink迭代API来实现具体算法。原创 2020-05-30 04:30:58 · 893 阅读 · 0 评论 -
Alink漫谈(四) : 模型的来龙去脉
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将从模型角度入手带领大家来再次深入Alink。原创 2020-05-23 08:21:59 · 555 阅读 · 0 评论 -
[Alink漫谈之三] AllReduce通信模型
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将带领大家来分析Alink中通讯模型AllReduce的实现。AllReduce在Alink中应用较多,比如KMeans,LDA,Word2Vec,GD,lbfgs,Newton method,owlqn,SGD,Gbdt, random forest都用到了这个通讯模型原创 2020-05-17 08:58:38 · 1447 阅读 · 0 评论 -
Alink漫谈(二) : 从源码看机器学习平台Alink设计和架构
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文是漫谈系列的第二篇,将从源码入手,带领大家具体剖析Alink设计思想和架构为何。原创 2020-05-16 17:05:48 · 1214 阅读 · 0 评论 -
Alink漫谈(一) : 从KMeans算法实现不同看Alink设计思想
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将带领大家从多重角度出发来分析推测Alink的设计思路。原创 2020-05-16 12:17:23 · 1444 阅读 · 3 评论