![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
我叫龙翔天翼
广告,推荐,AI算法,hive, spark
展开
-
Andrew Ng Stanford机器学习公开课 总结(5) Lecture 5 高斯判别分析和朴素贝叶斯
layout: posttitle: Andrew Ng Stanford机器学习公开课 总结(5)subtitle: Lecture 5 高斯判别分析和朴素贝叶斯date: 2019-07-19author: ZhangWenXiangheader-img: img/post-bg-cook.jpgcatalog: truetags:-...翻译 2019-07-21 12:35:15 · 325 阅读 · 0 评论 -
LSH以及Look-alike 技术总结: Similarity-based,Regression-based,Attention-based
Look-alike简介Look-alike是在线营销活动中常用的一种技术,目的是根据广告主提供的用户,帮助其进行人群圈选。Look-alike的输入是一个user列表(可以是user id 或者电话号码等id标识),这个user列表可以是广告主上一次活动的人群,可以是广告主的已有用户中高净值人群等等。这个输入人群列表有个专有名次叫做“种子用户(seeds)”。而Look-alike的输出还是一...原创 2019-07-26 11:45:14 · 2279 阅读 · 3 评论 -
Andrew Ng Stanford机器学习公开课 总结(12):k-means, 混合高斯分布, EM算法
Lecture 12 k-means, 混合高斯分布, EM算法本节主要讨论非监督学习的集中算法1. k-means clustering algorithmk-means算法是一种无监督的聚类算法,给定一个训练结合{x(1), . . . , x(m)},并没有标签y的信息,k-means的目的是将数据分为若干簇(cluster)。k-means算法比较简单且容易理解,具体算法流程如下:...翻译 2019-07-26 11:56:43 · 361 阅读 · 0 评论 -
Spark中的UDAF简介及其Stage task
Spark中的UDAF简介及其Stageudaf操作会分为两个stage:partial_merge: 本地进行merge,是一种窄依赖。tasks数量取决于上一步的partitions。merge:不同partition的数据进行merge,是一种宽依赖,需要shuffle,因此tasks数量取决于设置的值spark.default.parallelismclass ...原创 2019-08-09 20:14:59 · 303 阅读 · 0 评论