自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Datawhale X 李宏毅苹果书 AI夏令营 Task-1

如果每次训练都看全部数据,其实每次训练都是一样的, 训练中碰到stuck点,就卡住了;如果更新是在各个不同的batch里面完成, 梯度方向有多样性, 可能会帮助克服一些stuck点;Epoch: 训练所有数据的一次操作, 可由许多 batch 组成;当batch的数据量就是所有的数据时(Full batch), batch等于epoch;batch size 大一点 并不会明显 增加 batch 的训练时间。本质上新参数的方向及数值是 之前所有的 gradient 来决定的;

2024-08-24 17:05:16 278

原创 Datawhale AI夏令营第四期 魔搭-AIGC方向 task03笔记

了解了 LORA 模型的本质, 是原模型部分参数的调整, 使用时, 先要把LORA模型(参数)加载到原模型里面, 然后再执行. 这个就是微调的作用.学习了 comfyui 使用流程工作来构建文生图解决方案, 执行没问题;但comfyUI很不稳定, 经常出现重连, 导致图片生成失败.本质上跟task1是一样的, 只是很多的参数配置用UI的方式来完成, 方便了调试过程.另外使用Qwen来生成故事提示词, 非常方便.对于模型里面的工作机理, 还需要继续专研.

2024-08-17 21:20:27 69

原创 Datawhale AI夏令营第四期 魔搭-AIGC方向 task02笔记

现在大数据处理模型很多,用户在应用大数据分析时,除了将 Hadoop 等大数据平台作为一个存储和批处理平台之外,同样也得关注系统的扩展性和性能。过去开源社区已经发布了很多工具来完善大数据分析的生态系统,这些工具包含了数据分析的各个层面,例如。Apache Arrow 是 Apache 基金会全新孵化的一个顶级项目。它设计的目的在于作为一个跨平台的数据层,来加快大数据分析项目的运行速度。ds 可以先访问 行, 再访问列;也可以先访问列, 再访问行;而 Arrow 则是最新加入的一员,它。

2024-08-14 22:59:53 92

原创 Datawhale AI夏令营第四期 魔搭-AIGC方向 task01笔记

1. 申请阿里云的算例资源试用 5000U 的资源包, 第二天可以看到使用情况, 最多使用3个月;5. 提示词里面出现的描述会在图片上重点体现, 提示词越具体, 生成图片效果越好. 但太复杂的提示词模型理解不了, 会有错误出现. 感觉与模型参数有关系.3. 教程里面用了很多 ModelScope 提供的python module, 封装了许多训练推理的过程, 需要后面进一步深入研究其用法及背后的原理.6. 多次生成图片后,出现内存不足问题, 不知道有啥方法可以释放内存,但保留程序运行结果,避免重复训练.

2024-08-10 15:33:17 192

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除