自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

转载 Hive中collect_list全局保持顺序

我用部署的是standalone模式,local单节点计算的时候,结果没问题,当集群计算的时候因为是分布式的,因此结果是乱序的。解决方法如下:有以下Hive表的定义:create table topic_recommend_score ( category_id int, topic_id bigint, score double, rank int);这张表是我们业务里话题推荐分值表的简化版本。category_id代表分类ID,topic_id是话题ID,score是评

2021-11-24 15:15:56 1394

原创 excel用vlookup匹配多列数据

https://jingyan.baidu.com/article/1974b2893cce60f4b0f7744e.html

2021-05-12 14:51:17 780

原创 excel一列统一加上符号

https://jingyan.baidu.com/article/5d368d1eb136103f60c0579f.html

2021-05-07 10:30:54 1299

原创 excel一列转成一个单元格

http://www.gpsvo.com/fanwen/55550/

2021-05-07 10:21:46 859

原创 推荐系统学习笔记

文章目录一、推荐系统整体结构二、具体技术embedding一、推荐系统整体结构推荐系统技术演进趋势:从召回到排序再到重排二、具体技术embedding推荐系统 embedding 技术实践总结深度学习中的embedding...

2021-02-10 10:49:39 101

原创 git删除仓库

find . -name “.git” | xargs rm -Rf

2021-02-01 18:52:11 101

转载 Git 常用命令大全

git init # 初始化本地git仓库(创建新仓库)git config --global user.name "xxx" # 配置用户名git config --global user.email "xxx@xxx.com" # 配置邮件git config --global color.ui true .

2021-01-01 00:08:39 61

原创 vscode中Markdown换行设置

之前直接在vscode中复制文字代码,预览中都跑到同一行中了。打开设置,搜索setting.json,添加"markdown.preview.breaks": true这样就可以换行了

2020-12-18 15:33:25 4820 2

转载 用机器学习来提升你的用户增长:第四步,客户流失预测

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶” 作者:Barış KaramanFollow 编译:ronghuaiyang 正文共:8484 字 13 图 预计阅读时间:25 分钟 导读 我们通过客户分群和终生价值的预测得到了我们的最好的客户,对于这部分的客户,我们需要全力的留住他们,那么具体应该怎么做呢。 前文回顾: 用机器学习来提升你的用户增长:第一步,了解你的目标 用机器学习来提升你的用户增长:第二步,客户分群 用机器学习来提升你的用户增长:...

2020-12-09 17:37:04 540

转载 Hadoop MapReduce八大步骤以及Yarn工作原理详解

Hadoop是市面上使用最多的大数据分布式文件存储系统和分布式处理系统, 其中分为两大块分别是hdfs和MapReduce, hdfs是分布式文件存储系统, 借鉴了Google的GFS论文. MapReduce是分布式计算处理系统, 借鉴了Google的MapRed...

2020-12-07 16:33:35 175

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除