![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
AI炼丹
文章平均质量分 63
jstar1823
这个作者很懒,什么都没留下…
展开
-
走进AI大模型的瘦身房,看看如何把大模型塞进我们的手机里
然而,这些AI大模型往往参数众多,体积庞大,需要依赖庞大的网络计算资源,如何让大模型能在个人电脑,甚至手机上运行成为了有趣的探索目标。知识蒸馏则是将一个庞大复杂的模型的知识,转嫁给一个更简单的模型。模型压缩和剪枝就像是给机器学习模型的“减肥计划”。原创 2024-06-07 11:51:27 · 454 阅读 · 0 评论 -
论AI大模型炼丹与练舞的关系
你需要选择一个与芭蕾舞相近的机器人模型来入手,你只需要给机器人更多关于芭蕾舞的视频,特别是那些与你目标风格最接近的表演。模型就不会被训练数据中的偶然特征所迷惑,从而在遇到新的、未知的数据时,能够更好地做出准确的预测。原创 2024-05-28 21:30:07 · 818 阅读 · 0 评论 -
带你进入700亿参数AI大模型的神秘建筑工地,看看里面都有些啥
在神经网络的语境中,这些积木就是权重和偏置,它们通过不断学习来调整自己的值,从而使整个网络能够正确地执行任务,如识别图片中的猫或预测明天是什么天气。在这个奇妙的数据王国中,有一个正在建设中的,被称为神经网络的宏伟城堡。建造一个现实中的城堡需要大量的材料、工具,同样,构建和训练一个神经网络也需要相当多的数字资源。原创 2024-05-23 11:47:41 · 690 阅读 · 2 评论 -
如何选择一个AI大模型的私家炼丹炉
简单来说,它是GPU中的处理元件,负责执行用户通过CUDA编程语言编写的程序,专门用于执行并行计算任务。例如,与前一代的Pascal架构相比,搭载了第一代Tensor Core的Volta架构在用于深度学习训练的峰值TFLOPS性能上提升了高达12倍,而在推理任务上的峰值TFLOPS性能提升了高达6倍。它通过低分辨率的图像训练AI模型,然后该模型预测出高分辨率的图像细节,这一过程需要大量的计算资源,特别是在实时游戏和应用程序中,而这些计算任务正是由NVIDIA显卡中的Tensor Core完成的。原创 2024-05-21 22:46:29 · 1381 阅读 · 2 评论