周报6_YMK

周报6

  • 本周主要在看代码:看Medusa头的代码发现不是很了解base_model那部分,所以又去看了llama2的代码和一些相关博客。

  • 重写了一部分佛山中医学院项目的代码,更规范一些。

  • 调研CosmoFlow,是一个深度学习预测宇宙参数的模型,旨在在现代 HPC 平台上处理大型 3D 宇宙学数据集。基于TensorFlow 框架,执行在两个 HPC 系统——Cori(美国) 和 Piz Daint(瑞士)。

他的模型很小,是简单的CNN,700 万个参数(28.15 MB )。

在这里插入图片描述

样本101,056 个,输入是[128, 128, 128]的空间张量(暗物质分布),输出是3个宇宙学参数

在这里插入图片描述

最大运行使用 Cori 的 8192 个 KNL 节点,训练 130 个epoch。平均 epoch 3.35 秒,整个运行大约需要 9 分钟。

个人觉得把CNN换成大模型是可行的。具体会存在哪些瓶颈我后面还需要去了解一下。

一些想法:

感觉扩散模型的逆扩散过程(生成)也可以用美杜莎头的思想来加快生成速度,因为扩散模型在生成过程中需要一个step一个step来去噪得到图片,所以或许也可以用几个小模型当做美杜莎头打草稿,经过几个step后用原模型校验一下,循环这个过程达到加快生成过程的目的。

一下,循环这个过程达到加快生成过程的目的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值