- 博客(10)
- 资源 (1)
- 收藏
- 关注
转载 Hive中collect_list全局保持顺序
我用部署的是standalone模式,local单节点计算的时候,结果没问题,当集群计算的时候因为是分布式的,因此结果是乱序的。解决方法如下:有以下Hive表的定义:create table topic_recommend_score ( category_id int, topic_id bigint, score double, rank int);这张表是我们业务里话题推荐分值表的简化版本。category_id代表分类ID,topic_id是话题ID,score是评
2021-11-24 15:15:56 1484
原创 excel用vlookup匹配多列数据
https://jingyan.baidu.com/article/1974b2893cce60f4b0f7744e.html
2021-05-12 14:51:17 803
原创 excel一列统一加上符号
https://jingyan.baidu.com/article/5d368d1eb136103f60c0579f.html
2021-05-07 10:30:54 1347
原创 推荐系统学习笔记
文章目录一、推荐系统整体结构二、具体技术embedding一、推荐系统整体结构推荐系统技术演进趋势:从召回到排序再到重排二、具体技术embedding推荐系统 embedding 技术实践总结深度学习中的embedding...
2021-02-10 10:49:39 109
转载 Git 常用命令大全
git init # 初始化本地git仓库(创建新仓库)git config --global user.name "xxx" # 配置用户名git config --global user.email "xxx@xxx.com" # 配置邮件git config --global color.ui true .
2021-01-01 00:08:39 66
原创 vscode中Markdown换行设置
之前直接在vscode中复制文字代码,预览中都跑到同一行中了。打开设置,搜索setting.json,添加"markdown.preview.breaks": true这样就可以换行了
2020-12-18 15:33:25 5087 2
转载 用机器学习来提升你的用户增长:第四步,客户流失预测
点击上方“AI公园”,关注公众号,选择加“星标“或“置顶” 作者:Barış KaramanFollow 编译:ronghuaiyang 正文共:8484 字 13 图 预计阅读时间:25 分钟 导读 我们通过客户分群和终生价值的预测得到了我们的最好的客户,对于这部分的客户,我们需要全力的留住他们,那么具体应该怎么做呢。 前文回顾: 用机器学习来提升你的用户增长:第一步,了解你的目标 用机器学习来提升你的用户增长:第二步,客户分群 用机器学习来提升你的用户增长:...
2020-12-09 17:37:04 567
转载 Hadoop MapReduce八大步骤以及Yarn工作原理详解
Hadoop是市面上使用最多的大数据分布式文件存储系统和分布式处理系统, 其中分为两大块分别是hdfs和MapReduce, hdfs是分布式文件存储系统, 借鉴了Google的GFS论文. MapReduce是分布式计算处理系统, 借鉴了Google的MapRed...
2020-12-07 16:33:35 183
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人