自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(90)
  • 收藏
  • 关注

原创 云服务器配置 docker-spark

得先去控制台防火墙添加一下 50070 和 8080 这两个端口。还有一个问题就是 Docker 总是需要敲 sudo,可以参考。由于这里分配的内存太小,所以触发了这个限制,导致任务无法运行。提交任务的时候似乎是有一个最小内存的限制,具体分析可以看。由于规格比较小,所以并不能够撑起较大的服务,我之前按照。之前配置的时候,感觉机器内存小,所以启动容器的时候给。节点的内存改小了,毕竟服务器规格也小。后来就改成分配 1 G 的内容了。配置过一版,直接卡掉,重启才行。后来找了个小型的,参考。

2024-03-26 19:46:59 529

原创 离线数仓的优化及重构

每次任务运行之前都会检查运行历史,如上次任务未结束则跳过此次运行,如连续失败五次则触发企业微信机器人进行预警,其他情况正常运行。然后是结构问题,原平行结构对环境的影响压力过大,在合并小文件后运行效率有所提升,在不触及数据更新容忍度的情况下,将。这样一来,数仓部分对这张表就只有读取部分,去掉写入,不再产生相关的锁,大大提升了运行效率。在代码当中埋了一些输出点之后,经过对行为日志的分析,我们发现最慢的部分是在数据转换的。也就是说,这张表的数据,在这个字段上是有序的。根据控制表当中的记录,选取还未处理的。

2024-03-25 18:12:14 1064 1

原创 ydata-profiling 汉化魔改

后面遇到什么奇奇怪怪的,没有被翻译到的单词,都可以通过这种方式来定位,然后再进行翻译。这一块主要是调整文档的结构,一些地方可以通过调整设置来进行更改,可以参考。汉化翻译,报告结构到图片坐标再到鼠标悬停的提示,都搞成中文。文件里面的设置,或者直接新建一个,然后使用这个新的配置文件。毕竟被调用的类就在这里面写着,然后这里面的某一个主部分是是。里面有新模块的数据,也就是说新模块的计算过程要放在生成。啊,对了,有必要说一下我下面举例所使用的版本,是。除此之外,还要对新模块的展示创建代码,主要是在。

2024-03-21 20:34:36 1138

原创 VS Code 配置 Markdown 环境

以及尽量不要删除打开文件夹的历史记录,否则该文件夹下启用的插件在再次打开该文件夹时会保持禁用,因为记录他们启用的配置数据与历史记录好像在一起放着。一般而言我是禁用所有插件,主要是为了偶尔右键单击打开某单个文件进行编辑,提高这个场景下的启动速度。的,貌似也有通过这个方法来生成目录的,但是看起来很复杂,我没有仔细研究,可以参考。关于导出的设置,也有一些调整的东西,可以参考。在用这个的时候,我调了下字体,但没成功,查。文件的前几页,带超链接跳转的,这个是目录。,因为默认的配置显示的中文很奇怪,参考。

2024-03-20 20:39:04 1384

原创 PowerShell 无法保留窗口和字体设置

这不就是我遇到的问题嘛,于是在没有备份的情况下对着注册表一顿乱改。实在是太大胆了,还好没出问题。窗口,发现字体很小、窗口也小,看着很不舒服,于是决定改设置。将非等宽字体加入列表会导致整个列表崩溃,字体回到点阵字体。但是改完之后还是不行,又翻了很多博客,找到一个神奇的。大意就是,不要盯着这个字体死磕,不行就换个字体去设置。但是很可惜只能保持到此次会话结束,再打开新窗口又是。于是右键属性换了一个,设置就保留下来了,非常的。总之就是某一天调起原生的。于是开始查教程,找到一个。

2024-03-20 18:43:41 415

原创 Win10 自用 Bat 脚本小工具

主要是两个点吧,其一是一些常用的命令啊或者什么的,有时候在命令行记不住;然后是一些命令太长了,每次都打太麻烦。这个类别主要是,根据输入的参数,在命令行输出指定的文件里面的内容,也就是相应的类似于帮助文档一类的东西。脚本文件所在的文件夹加入到环境变量当中,这样就可以把他们当作全局命令来随处调用,具体操作就不赘述了。教程一类的,首先是整体的结构,肯定是一个选择分支,参考。,我之前也是在其他地方找到的这个写法,懒得改了。为了调一下格式,我们还需要输出一些空行,参考。的,这里我们需要一个。

2024-03-20 18:08:13 838

原创 安卓手机配置通用多屏协同及自动化脚本

不过倒是,我记得,有段时间貌似连接不稳,就是有线接上之后,电脑没有识别到手机,我记得好像也有原因来着,忘记当时咋解决的了,反正不行就尝试多插拔几次。首先开启开发者模式,嗯,各个机型开启的方式不同,大概就是连续点击系统版本三到五次吧,在此不做赘述,有需要的话去其他地方查一下,很简单的。,所以共享手机音频到电脑用的好像还算蓝牙,也就是说如果想在共享屏幕上听声音,那在有线或者无线的基础上,连接上蓝牙。还有,这种方式没有调试信息,如果不能运行成功,建议去命令行启动,或许会有报错信息,方便调试。

2024-03-20 17:21:18 1053

原创 数位板配置通用画笔橡皮快捷键

首先我们要先知道自己屏幕的分辨率,然后根据这个分辨率确定画笔按钮所在的区域,选一个落在这个区域的点,使得点击这个坐标点就能触发画笔。由于我们先按的键盘,后运行的可执行程序,所有从这里我们可以看到的是,前五行代表键盘消息,后五行代表虚拟键盘的消息。一个很显然的问题是,这个貌似也是挺麻烦的,我最早的想法是直接根据窗口去抓进程,去看看属于哪个软件,以此来确定接下来需要触发的快捷键。这样的窗口,点击窗口聚集,然后按一下刚刚绑定的快捷键,看一看这个窗口标题被截取到的关键词是什么,截取到的关键词就是判断条件。

2024-03-19 17:26:30 1331

原创 win10 使用 IIS 搭建 FTP

首先描述一下需求,大概情况就是,视频文件是存储在笔记本电脑里面,然后偶尔需要投屏到电视上。之前考虑过是否可以通过U盘拷贝的方式,后来发现不行,这样太局限了,需要先明确可能用到的教程,然后花费一定时间拷贝,再去电视上面播放当然这样的好处是没有卡顿,不过我需要的是简便。于是有了那么一个,比较神奇的方案,就是电脑开FTP,然后手机VLC访问并播放,再投影到电视上…当然某些智能电视或者电视盒子也支持直接访问FTP此外我也试过SMB,然后折腾了一下发现没搞懂,就算了。

2024-03-18 20:02:09 1693

原创 Windows Terminal 配置 oh-my-posh

还有就是要说一下第一个图标,最早我设置的是显示完整路径,然后去到一些比较深层的地方后,路径过长,直接换行了,然后就导致排版有些错乱,最后我选择了只显示目录,因为这样最短。里面什么乱七八遭的组件都有,比如说电池电量、充电状态、内存占用,反正花里胡哨的,自己看着搭吧,我是以简洁为主,只保留自己需要的东西,其余的全给删了。一开始不是这样的,一开始还挺大的,包括第一行的文件夹图标什么的,后来。更新了一次,应该是更改了字体渲染相关的部分,然后图标就变小了,后面又更新了几次,也没恢复,图标还是很小。

2024-03-17 18:29:37 1348

原创 Transformers中的动态学习率

我这里用的是当时学 Pytorch 时搭的简单模型1,网络结构的示意图大致如下所示,是 FashionMNIST 的多分类任务贴一下主要代码:噢,对了,我用的 GPU,设备信息如下:嗯,对,我还用了 TensorBoard,当时想看看 Loss 和学习率。因为感觉不太对,这个东西用在 CV 上就很奇怪刚开始的时候忘记分文件夹了,每次训练的展示数据都混在一起,画出来的图群魔乱舞后来按时间建文件夹,每个 epoch 一个,然后把路径传入 SummaryWriter我记得在 TF2 里面是传入 callb

2022-06-19 23:05:16 4066 2

原创 Task06:秋招秘籍 C

Task06:秋招秘籍 C教程地址1. 行转列2. 列转行3. 连续登录4. 用户购买商品推荐5. hive 数据倾斜的产生原因及优化策略?6. LEFT JOIN 是否可能会出现多出的行?为什么?教程地址https://github.com/datawhalechina/wonderful-sqlhttps://gitee.com/datawhalechina/wonderful-sql1. 行转列建表mysql> DROP TABLE IF EXISTS exercise;Query

2022-05-29 21:49:09 288

原创 Task06:秋招秘籍 B

Task06:秋招秘籍 B教程地址1. 行转列2. 列转行3. 谁是明星带货主播4. MySQL 中如何查看sql语句的执行计划?可以看到哪些信息?5. 解释一下 SQL 数据库中 ACID 是指什么教程地址https://github.com/datawhalechina/wonderful-sqlhttps://gitee.com/datawhalechina/wonderful-sql1. 行转列建表mysql> DROP TABLE IF EXISTS exercise;Quer

2022-05-29 20:17:40 324

原创 Task06:秋招秘籍 A

Task06:秋招秘籍 A教程地址1. 各部门工资最高的员工1.1 Employee 表1.2 Department 表1.3 各部门工资最高的员工2. 换座位3. 分数排名4. 连续出现的数字5. 树节点6. 至少有五名直接下属的经理7. 查询回答率最高的问题8. 各部门前3高工资的员工9. 平面上最近距离10. 行程和用户教程地址https://github.com/datawhalechina/wonderful-sqlhttps://gitee.com/datawhalechina/wonde

2022-05-29 17:59:16 261 1

原创 Task05:SQL高级处理

Task05:SQL高级处理教程地址1. 窗口函数1.1 简介1.2 专用函数1.3 聚合函数1.4 移动平均2. rollup3. 存储过程4. 预处理A.练习题A.1A.2A.3A.4教程地址https://github.com/datawhalechina/wonderful-sqlhttps://gitee.com/datawhalechina/wonderful-sql1. 窗口函数1.1 简介窗口函数还有一个别名是,OLAP 函数,也就是 OnLine Analytical Proc

2022-05-27 17:45:30 141

原创 Task04:集合运算

Task04:集合运算教程地址1. 表的加减法1.1 union1.1.1 优先展示1.1.2 合并结果1.1.3 保留重复1.1.4 类型转换1.2 intersect1.3 except1.4 对称差2. 连结2.1 内连结2.1.1 普通连接2.1.2 结合 where2.1.3 结合 group by2.1.4 自然连接2.2 外连结2.2.1 左连接2.2.2 结合 where2.2.3 全外连接2.3 多表连接2.3.1 多表内连接2.3.1 多表外连接2.4 非等值连接2.5 交叉连接2.6

2022-05-26 00:44:39 285

原创 Task03:复杂一点的查询(二)

Task03:复杂一点的查询(二)教程地址3. 各种各样的函数3.1 算术函数3.1.1 绝对值3.1.2 求余3.1.3 四舍五入3.2 字符串函数3.2.1 拼接3.2.2 长度3.2.3 大小写转换3.2.4 替换3.2.5 截取3.2.6 索引截取3.2.7 重复3.3 日期函数3.4 转换函数4. 谓词4.1 like4.2 between4.3 null 判断4.4 in4.5 exist5. case表达式B.练习题B.1B.2B.3教程地址https://github.com/dataw

2022-05-25 21:06:44 109

原创 Task03:复杂一点的查询(一)

Task03:复杂一点的查询(一)教程地址1. 视图1.1 什么是视图1.2 视图与表的区别1.3 为什么会存在视图1.4 如何创建视图1.5 如何修改视图结构1.6 如何更新视图内容1.7 如何删除视图2. 子查询2.1 什么是子查询2.2 子查询和视图的关系2.3 嵌套子查询2.4 标量子查询2.5 标量子查询有什么用2.6 关联子查询A. 练习题A.1A.2A.3A.4教程地址https://github.com/datawhalechina/wonderful-sqlhttps://gitee

2022-05-21 16:42:42 250

原创 Task02:基础查询与排序(二)

Task02:基础查询与排序(二)教程地址4. 对表进行聚合查询5. 对表进行分组6. 为聚合结果指定条件7. 对查询结果进行排序B. 练习题B.1B.2B.3教程地址https://github.com/datawhalechina/wonderful-sqlhttps://gitee.com/datawhalechina/wonderful-sql4. 对表进行聚合查询SQL中用于汇总的函数叫做聚合函数。以下五个是最常用的聚合函数:COUNT:计算表中的记录数(行数)SUM:计算表中数值

2022-05-17 22:19:38 165

原创 Task02:基础查询与排序(一)

Task02:基础查询与排序(一)教程地址1. SELECT语句基础1.1 从表中选取数据1.2 限定条件选取数据1.3 相关规则2. 算术运算符和比较运算符2.1 算术运算符2.2 比较运算符2.3 相关规则3. 逻辑运算符3.1 NOT运算符3.2 AND运算符和OR运算符3.3 真值表A. 练习题A.1A.2A.3A.4教程地址https://github.com/datawhalechina/wonderful-sqlhttps://gitee.com/datawhalechina/wonde

2022-05-17 17:10:14 219

原创 Task01:环境搭建,初识数据库

1. 安装数据库ubuntu@VM-0-12-ubuntu:~$ lsb_release -aNo LSB modules are available.Distributor ID: UbuntuDescription: Ubuntu 20.04 LTSRelease: 20.04Codename: focalubuntu@VM-0-12-ubuntu:~$ 先来看一下系统信息,我这个是腾讯云服务器上面的Ubuntu 20.04然后之前在做Juicy Big Data中Hive部分的时候

2022-05-15 15:19:53 871

原创 PyS2:RDD编程基础(二)

5. 分区相关的操作分区的作用主要是增加并行度和减少通信开销。增加并行度就不需要多说了,我们主要来聊一聊减少通信开销。我看书上的意思大概是说分区之后避免了后续处理当中的Shuffle操作,意思是已经把数据给排列好了的感觉,所以说不用后面一次又一次地重新Shuffle。分区默认的方法有HashPartitioner和RangePartitioner,前者是根据Key进行分区,后者是为了更好地排序。5.1 改变分区的函数5.1.1 coalesce>>> rdd = sc.paral

2022-04-27 21:06:24 324

原创 PyS2:RDD编程基础(一)

PyS1:RDD编程基础0. 环境设置1. RDD的创建方式1.1 RDD的数据结构1.2 从本地文件创建RDD1.3 从集群文件创建RDD1.4 在代码当中创建RDD2. RDD的执行函数2.1 collect函数2.2 take函数2.3 first函数2.4 takeSample函数2.5 count函数2.6 reduce函数2.7 foreach函数2.8 countByKey函数2.9 saveAsTextFile函数3. RDD的转换函数3.1 map函数3.2 flatMap函数3.3 fi

2022-04-26 10:58:39 2334

原创 PyS1:概述

我没有去文件夹做验证,但据我之前的使用经验来看好像是这样的,我之前貌似在 win10 上单独装过 PySpark,反正是能运行的,对于学习而言一般是够用的。每个任务有自己专属的采用多线程的方式来执行任务,并且在任务执行的过程当中一直保持着驻留的状态。所采用的多进程模型来说,这样的设计避免了多进程任务频繁的启动开销,使得任务执行变得更加高效和可靠。窄依赖表现为一个父RDD的分区对应于一个子RDD的分区或多个父RDD的分区对应于一个子RDD的分区。我还发现了一个很好的教程,用的和鲸社区,这是代码。

2022-04-20 22:03:09 2022

原创 头大毕设论文模板适配指南

头大毕设论文模板适配指南1. 环境配置2. 主文件适配3. 配置文件适配4. 校名适配5. 标题适配6. 格式转换7. 其他细节1. 环境配置学校好像给了一个word版本的毕设要求,各个部分的字体和字号等,但还是latex比较香我们这里是基于win 10系统,选用清华的模板1,主要是感觉字体比较好看,版本是7.2.42首先从VS Code开始配置,需要下载TexLive,大致流程参考3,也可以看4总之TexLive劲儿非常大,有4.3GB 呢,而且安装还需要40+分钟,很费时间TexLive安装

2022-04-19 21:22:58 349

原创 Task04:PyTorch生态简介

Task04:PyTorch生态简介1. torchvision(图像)2. PyTorchVideo(视频)3. torchtext(文本)1. torchvision(图像)torchvision.datasets:计算机视觉领域常见的数据集,包括CIFAR、EMNIST、Fashion-MNIST等torchvision.transforms:数据预处理方法,可以进行图片数据的放大、缩小、水平或垂直翻转等torchvision.models:预训练模型,包括图像分类、语义分割

2022-03-24 16:18:44 3576

原创 Jbd8:总结

Jbd8:总结1. 框架综述2. 大数据分析引擎的发展简史2.1 萌芽阶段(2003-2008)2.2 快速发展阶段(2009-2014)2.3 成熟阶段(2015-至今)2.4 大数据分析引擎发展方向1. 框架综述一般来说,大数据框架在总体上分为存储引擎和计算分析引擎存储引擎通常用来存储海量数据,而分析引擎通常用来分析海量数据2. 大数据分析引擎的发展简史值得说明的是,该时间标注的是技术出现的时间。在生产环境中,这些技术得到大量运用的时间要比出现时间晚5-10年左右。2.1 萌芽阶段(

2022-03-23 14:39:32 1025

原创 Jbd7:Spark

Jbd7:Spark0. 引言1. Spark概述1.1 Spark的诞生1.2 Spark与Hadoop、MapReduce、HDFS的关系1.3 Spark生态体系2. Spark编程模型2.1 RDD概述2.2 RDD定义2.3 RDD五大特性2.3.1 分区2.3.2 并行计算2.3.3 依赖关系2.3.4 KV分区器2.3.5 优先位置列表2.4 RDD操作函数3 Spark架构原理3.1 Spark计算阶段3.2 如何划分计算阶段3.3 Spark 作业管理3.4 Spark 执行过程4. Sp

2022-03-23 14:39:04 2222 2

原创 Task03:PyTorch可视化

Task03:PyTorch可视化1. 可视化网络结构1.1 模型基础信息1.2 可视化网络结构2. CNN可视化2.1 卷积核可视化2.2 特征图可视化2.3 class activation map可视化2.4 CNDD可视化3. TensorBoard可视化训练过程3.1 基本逻辑3.2 模型结构可视化3.3 图像可视化3.4 连续变量可视化3.3 参数分布可视化1. 可视化网络结构1.1 模型基础信息>>> import torchvision.models as model

2022-03-22 19:29:38 359

原创 Jbd6:Hive

Jbd6:Hive0. 数据仓库0.1 为什么要有数据仓库0.2 数据仓库概念0.3 数据仓库的体系结构0.4 面临的挑战1. Hive基本概念1.1 概述1.2 产生背景1.3 Hive与Hadoop生态系统1.4 Hive与传统数据库的对比1.5 模拟实现Hive2. Hive核心概念2.1 Hive数据类型2.1.1 基本数据类型2.1.2 隐式转换2.1.3 复杂类型2.1.4 示例2.2 Hive数据模型2.2.1 库2.2.2 表2.2.3 分区2.2.4 分桶3. Hive系统结构3.1 用户

2022-03-21 21:57:17 38708

原创 Jbd5:MapReduce

传统并行传统的程序都是以单指令、单数据流的方式顺序执行虽然这种方式比较符合人类的思维习惯,但是,其性能受到单台机器的限制,可扩展性较差分布式并行分布式并行程序可以运行在由大量计算机构成的集群上从而可以充分利用集群的并行处理能力而且可以向集群中增加新的计算节点来进行扩充MapReduce的核心是两个函数:Map和Reduce,其核心思想源自函数式编程语言。MapReduce设计的一个理念就是“计算向数据靠拢”,而不是“数据向计算靠拢"

2022-03-20 21:37:03 2069

原创 Jbd4:Hbase

Jbd4:Hbase0. 背景0.1 Hadoop的局限性0.2 HBase VS 传统数据库0.2.1 数据类型0.2.2 数据库类型0.2.3 数据库区别1. 概述1.1 HBase 简介1.2 HBase 访问接口2. HBase 数据模型2.1 数据模型概述2.2 模型相关概念2.3 数据坐标2.4 概念视图2.5 物理视图2.6 面向列的存储3. HBase的实现原理3.1 HBase功能组件3.2 表和Region3.2.1 相应概念3.2.2 分裂region3.2.3 region详情3.3

2022-03-19 22:12:23 1863

原创 Task02:PyTorch进阶训练技巧

Task05:PyTorch进阶训练技巧1. 自定义损失函数1.1 函数方式1.2 类方式2. 动态调整学习率2.1 官方API2.2 自定义scheduler3. 模型微调3.1 概念3.2 流程3.3 图示3.4 实践4. 半精度训练4.1 概念4.2 实践1. 自定义损失函数1.1 函数方式通过输出值和目标值进行计算,返回损失值>>> import torch>>> def my_loss(output, target):... loss = t

2022-03-19 19:45:26 1367

原创 Jbd3:HDFS

Jbd3:HDFS1. 概述1.1 分布式文件系统1.1.1 块的对比1.1.2 块的大小1.1.3 系统设计1.1.3.1 整体设计1.1.3.2 主节点、名称节点1.1.3.3 从节点、数据节点1.1.3.4 多副本设计1.2 HDFS简介1.2.1 优点1.2.1 缺点2. 体系结构3. 存储原理3.1 冗余存储3.2 存取策略3.2.1 数据存放3.2.2 数据读取3.2.3 数据复制3.3 错误与恢复3.3.1 主节点、名称节点出错3.3.2 从节点、数据节点出错3.3.3 数据出错4. 读写过程

2022-03-17 20:43:02 1303

原创 Task01:PyTorch模型定义

Task01:PyTorch模型定义1. 模型定义的方式1.1 Sequential1.1.1 直接排列1.1.2 OrderedDict1.2 ModuleList1.3 ModuleDict2. 搭建模型网络2.1 模型图示2.2 模型分析2.3 实现组件2.3.1 DoubleConv2.3.2 Down2.3.3 Up2.3.4 OutConv2.4 组装模型3. 修改模型3.1 原始模型3.2 修改模型层3.3 添加外部输入3.4 添加额外输出4. 模型保存与读取4.1 存储设置4.1.1 存储格

2022-03-16 16:28:17 1527

原创 Jbd2:Hadoop

Jbd2:Hadoop1. 发展历史2. 主要特性3. 部分组件3.1 HDFS3.2 HBase3.3 Sqoop3.4 Zookeeper4. 实践操作4.1 创建Hadoop用户4.2 安装Java4.2.1 安装jdk4.2.2 修改环境变量4.2.3 SSH登录权限设置4.3 单机版Hadoop4.3.1 安装Hadoop4.3.2 修改系统环境变量4.3.3 修改hadoop-env.sh文件配置4.4 伪分布式Hadoop4.4.1 修改core-site.xml文件配置4.4.2 修改hdf

2022-03-15 23:44:37 1558

原创 Jbd0:前言 & Jbd1:概述

Jbd00:前言1. Ubuntu2. 环境安装1. Ubuntu最近气温升高天气渐热,手里的全能本发热严重,开虚拟机的话烫到爆炸,所以还是继续用腾讯云吧,从centos换到ubuntu:ubuntu@VM-0-12-ubuntu:/opt$ uname -aLinux VM-0-12-ubuntu 5.4.0-96-generic #109-Ubuntu SMP Wed Jan 12 16:49:16 UTC 2022 x86_64 x86_64 x86_64 GNU/Linux然后腾讯云给的

2022-03-15 19:46:46 998

原创 Task01:熟悉新闻推荐系统的基本流程(项目结构)

Task01:熟悉新闻推荐系统的基本流程(项目结构)1. 文件说明2. 流程图示3. 架构图示[^1]1. 文件说明PS D:\Project\fun-rec\codes\news_recsys> tree /f /a卷 Data 的文件夹 PATH 列表卷序列号为 7876-8A9CD:.+---news_rec_server| || | README.md| | 说明文件| | | | requirements.txt| | 环境要求|

2022-03-14 23:33:22 445

原创 Task01:熟悉新闻推荐系统的基本流程(数据库设计)

Task01:熟悉新闻推荐系统的基本流程(数据库设计)0.代码版本1. 相关文件2. MySQL3. MongoDB4. Redis5. 流程图示0.代码版本该专栏的博客当中涉及的所有代码,均为组队学习期间的版本,大概在2021年12月12日左右,某一个可能的参考版本链接如下:https://github.com/datawhalechina/fun-rec/tree/9bcfafaae339c443cc7911b9070bf52adef9e9941. 相关文件PS D:\Project\fun-

2022-03-14 21:02:07 1548

原创 Task05:推荐流程的构建

Task05:推荐流程的构建0.代码版本1. 整体文件2. offline2.1 流程图示2.2 流程描述2.2.1 update_hot_value()2.2.2 group_cate_for_news_list_to_redis()2.2.3 generate_cold_user_strategy_templete_to_redis_v2()2.2.4 user_news_info_to_redis()3. online3.1 流程图示3.2 流程描述3.2.1 get_cold_start_rec_

2022-03-14 01:52:03 2233

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除