机器学习
文章平均质量分 65
东南枝DP
4年一线大厂经验,高级算法工程师
展开
-
浅析Attention在推荐系统中的应用(2)阿里Deep Interest Network模型
欢迎关注本人公众号: petertalks目录:浅析Attention在推荐系统中的应用(1)Attention简介浅析Attention在推荐系统中的应用(2)阿里Deep Interest Network模型浅析Attention在推荐系统中的应用(3)AutoInt模型浅析Attention在推荐系统中的应用(4)Transformer与阿里BST模型阿里妈妈算...原创 2020-03-17 17:19:22 · 530 阅读 · 0 评论 -
浅析Attention在推荐系统中的应用(1)Attention简介
欢迎关注本人公众号: petertalks前言Attention最早应用于图像领域,而后大面积用于seqs2seqs类型的任务如机器翻译等。随着17年google《Attention is all you need》的发表更是将attention推向热点。近几年无论是在nlp、还是推荐领域。attention机制可谓是大放异彩,从nlp领域的transformer、bert,xlne...原创 2020-03-17 17:14:29 · 1621 阅读 · 0 评论 -
Linear_regression与 Logistic_regression简单比较与python实现
Linear_regression与 Logistic_regression简单比较与实现好久没写博客了,在度厂实习期间更是天天累成了狗的节奏,最近有幸蹭到隔壁组老大小黑黑关于machine learning这块的培训(以下图片均摘自小黑黑的PPT),甚是感动,决定好好学习下这块的东西。Linear_regression 和 Logistic_regression 其实是非常相似的两种算法。原创 2015-05-31 23:33:06 · 1249 阅读 · 1 评论 -
随机森林的简单实现
近日听了七月天空周博的课。现在对随机森林进行一下,简单的实现。随机森林(randomforest)是一种利用多个分类树对数据进行判别与分类的方法,它在对数据进行分类的同时,还可以给出各个变量(基因)的重要性评分,评估各个变量在分类中所起的作用。随机森林是一个最近比较火的算法,它有很多的优点:a. 在数据集上表现良好,两个随机性的引入,使得随机森林不容易陷入过拟合b. 在当前的很原创 2015-11-08 16:51:31 · 3830 阅读 · 0 评论 -
centos7安装python机器学习相关环境numpy,scipy,sklearn,lda
最近在学习LDA,打算用python去做些练习,在安装的时候遇到了一些坑,查了不少资料才明白原因,于是在下面做些简单的步骤总结跟大家分享下。1,首先安装pip yum -y install python-pip pip install --upgrade pip(更新pip)2, 安装numpy和scipy yum -y install gcc gcc原创 2017-04-30 16:34:52 · 2979 阅读 · 2 评论 -
xgboost/gdbt/randomforest + lr入门实践
最近在调研gdbt + lr相关的东西,这方面的东西最早是从facebook发表的一篇论文(https://pdfs.semanticscholar.org/daf9/ed5dc6c6bad5367d7fd8561527da30e9b8dd.pdf)开始的。大意就是利用gdbt模型的叶子节点作为lr模型的输入,起到了自动组合特征,简化lr特征工程的作用(如下图)。不多说,具体看代码。#原创 2017-11-22 17:53:13 · 3533 阅读 · 0 评论 -
记一次spark mllib stackoverflow踩坑
以前做als相关的东西的时候,都是用的公司的内部工具居多,今天第一次用了下spark的mlib,拿了个几M的小数据集试了个水。。结果一跑,我擦。。。居然stackoverflow了。。源码如下:from pyspark.mllib.recommendation import ALSfrom numpy import arrayfrom pyspark import Spar原创 2017-11-24 17:30:32 · 3115 阅读 · 6 评论 -
LDA漫游指南阅读笔记--Gibbs采样
Gibbs采样公式:LDA并行考虑:列 某文章的单词A依赖于另外一个文章相同单词A采样后修改的nw,nwsum行 同一篇文章的后一个单词依赖于前一个单词修改后的nd,ndsum主题 同一个主题后一次采样依赖于同一个主题前一次采样的nwsum解决方案:1. AD-LDA 按行进行拆分,nd,ndsum拆分到各台机器, nw,nwsum被完全copy到各台机器.各个节点一轮执行完毕后,进行一次merg...原创 2018-06-10 22:03:38 · 1489 阅读 · 0 评论