大模型
文章平均质量分 84
大模型前世今生
aimmon
这个作者很懒,什么都没留下…
展开
-
深度学习之开发环境(CUDA、Conda、Pytorch)准备(4)
CUDA(Compute Unified Device Architecture)是由NVIDIA公司推出的一种并行计算平台和编程模型,它使得开发者能够利用NVIDIA GPU的强大并行计算能力来加速计算密集型任务。CUDA 不仅是一种编程语言,更是一个完整的开发平台,包括了硬件、软件、驱动程序、库和工具等。Anaconda 是一个开源的 Python 和 R 语言的分发版本,主要用于数据科学、机器学习和大数据分析。原创 2024-09-26 07:25:56 · 1253 阅读 · 0 评论 -
深度学习之概率论预备知识点(3)
随机变量只能取有限个或可数个值,其概率通过概率质量函数(PMF)来表示。原创 2024-09-21 23:43:59 · 1077 阅读 · 0 评论 -
深度学习之微积分预备知识点(2)
极限是一种变化状态的描述,核心思想是无限靠近而永远不能到达总结: 对函数y = f(x)来说,其导数可以用符号f'(x)来表示。也可记为总结:定义:微分是导数的线性近似,表示函数在小变化下的增量。总结:微分近似小变大,导差线性接着算。总结:梯度下降算法中,参数更新公式为 总结:例子:有函数 和 , 计算 的导数,可得总结:原创 2024-09-16 22:01:28 · 952 阅读 · 0 评论 -
深度学习之线性代数预备知识点(1)
在深度学习中,内积用于衡量输入向量与权重向量的相似性。例如,在一个简单的神经元中,输入。:在神经网络的全连接层中,输入向量通过权重矩阵进行矩阵乘法,从而生成输出。,即输入与权重的内积结果。,表示三维空间中的向量。,输出为y=W×x。原创 2024-09-16 21:22:47 · 510 阅读 · 0 评论