- 博客(4)
- 收藏
- 关注
原创 ControlNet——AI图像生成的“精准操控工具”
此过程始于一个已能处理128K上下文长度的DeepSeek-V3.1-Terminus模型检查点,包含精心设计的持续预训练方案以及一个特意保持与 predecessor 模型完全一致的后训练流程,以确保评估的公*性和可控性。这些凝聚了专家模型精髓的蒸馏数据,随后被用于训练最终的通用模型。为了实现极致的速度,闪电索引器采用了轻量级设计,例如使用非常小的键缓存(据资料提及,每个Token仅128维),并能够利用FP8精度 在DeepSeek自研的DeepGEMM 算子上运行,从而为后续的注意力计算显著提速。
2025-11-03 23:46:15
231
原创 Rainbow-Sea
处于waitting状态是因为它在等任务执行,从堆栈可以看出是阻塞在TaskQueue.take方法,org.apache.tomcat.util.threads.TaskQueue是tomcat中的LinkedBlockingQueue,是生产者-消费者模型,take方法阻塞表示当前队列是空的,没有任务需要执行,一旦有任务放入TaskQueue,take方法就会唤醒,进入Runnable状态。这点就不好理解了,应用恢复了,为什么tomcat没有恢复,tomcat线程此时在做什么?
2025-11-03 23:42:12
901
原创 细说 ASP.NET控制HTTP缓存
这里需要知道dapo的reward_manager_cls 具体是什么,因为reward需要batch数据才能计算,因此对于reward manager咱们先按下不表(其实dapo对应的reward_manager_cls是在verl/verl/workers/reward_manager/dapo.py),先去dapo_ray_trainer.py看一下batch是怎么采样的,再回来仔细阅读reward的具体计算方法。# max_num_gen_batches是最多可以使用的gen_batch的个数。
2025-11-02 21:17:33
871
原创 INWindows (Part )
一旦虚拟机成功启动,Docker命令行工具就会自动连接到Colima提供的Docker守护进程,此时我们就可以在Mac上正常使用所有Docker命令了。# 当未指定时,会从https://github.com/abiosoft/colima-core/releases下载适当的磁盘镜像。colima start --cpu 1 --memory 2 --disk 10 ## 指定配置启动。# docker daemon的配置,即`daemon.json`# 为虚拟机指定自定义磁盘镜像。
2025-11-02 21:15:12
487
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅