- 博客(3)
- 收藏
- 关注
原创 DeepSeek技术研究报告:如何在有限资源下通过创新获取极致性能
本文通过分析公开的信息和资料,尤其是DeepSeek-V3和DeepSeek-R1的技术报告,探讨DeepSeek系列模型,包括DeepSeek-V3、DeepSeek-R1-Zero 和DeepSeek-R1的训练方法。详细介绍DeepSeek在大语言模型(large language model, LLM)架构上的创新和发展,对GPU集群负载均衡的改进,利用GPU底层语言PTX进行底层优化,以及实现软硬件系统(包括通信、内存和计算)的协同优化等。
2025-03-10 16:33:12
1773
原创 一张表看懂C#嵌套类和Java内部类的区别
C#静态嵌套类C#普通嵌套类Java静态内部类Java普通内部类static nested classnested classstatic inner classinner class代码class A{static class B{}}class A{class B{}}class A{static class B{}}class A{class B{}}B关联A的类类类实例对象B访问AA.xxxnew A()new A()A.t...
2021-03-10 11:06:35
701
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人