![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
AI
文章平均质量分 76
yongche_shi
这个作者很懒,什么都没留下…
展开
-
深度学习中,卷积运算为何能对图像矩阵进行升维降维?
最近有小伙伴表示不理解1*1卷积为何能对输入矩阵进行升维降维,所以我这里专门来讲一下。当然不止1*1卷积,其实所有不同kernel_size的卷积都能实现降维和升维。现在很多深度学习的第三方库,比如Pytorch、tensorflow帮我们完成了很多基础运算,但作为AI研究者,还是应该知道卷积具体在做什么。在这里,我默认读者知道数学上的卷积运算和互相关运算(cross-correlation),深度学习中,每一个卷积核实际上进行的是数学上的互相关运算。转载 2023-08-15 14:56:44 · 1083 阅读 · 0 评论 -
批梯度下降法(Batch Gradient Descent ),小批梯度下降 (Mini-Batch GD),随机梯度下降 (Stochastic GD)
Batch 的选择,首先决定的是下降的方向。随机梯度下降是通过每个样本来迭代更新一次,如果样本量很大的情况(例如几十万),那么可能只用其中几万条或者几千条的样本,就已经将theta迭代到最优解了,对比上面的批量梯度下降,迭代一次需要用到十几万训练样本,一次迭代不可能最优,如果迭代10次的话就需要遍历训练样本10次。(2)随机梯度下降—最小化每条样本的损失函数,虽然不是每次迭代得到的损失函数都向着全局最优方向, 但是大的整体的方向是向全局最优解的,最终的结果往往是在全局最优解附近。转载 2023-08-14 14:40:39 · 2882 阅读 · 0 评论 -
本地部署开源大模型的完整教程:LangChain + Streamlit+ Llama
通过LangChain和Streamlit我们可以方便的整合任何的LLM模型,并且通过GGML我们可以将大模型运行在消费级的硬件中,这对我们个人研究来说使非常有帮助的。如果你对本文感兴趣,这里是本文的全部源代码,可以直接下载使用:作者: Afaque Umer。转载 2023-08-03 10:00:21 · 578 阅读 · 0 评论 -
揭秘大模型背后的机理,清华49页长文全方位分析参数高效微调方案
机器之心专栏本文中,包括刘知远、唐杰、孙茂松等在内来自清华大学的研究者对大模型的参数高效微调进行了全方位的理论和实验分析。预训练语言模型 (PLM) 已经毫无疑问地成为各种 NLP 任务的基础架构,而且在 PLM 的发展中,呈现出了一个似乎不可逆的趋势:即模型的规模越来越大。更大的模型不仅会在已知任务上取得更好的效果,更展现出了完成更复杂的未知任务的潜力。转载 2023-08-01 10:29:24 · 255 阅读 · 0 评论 -
不会数学统计没关系——5分钟教你轻松掌握箱线图
箱线图也称箱须图、箱形图、盒图,用于反映一组或多组连续型定量数据分布的中心位置和散布范围。箱形图包含数学统计量,不仅能够分析不同类别数据各层次水平差异,还能揭示数据间离散程度、异常值、分布差异等等。箱线图(Box plot)也称箱须图(Box-whisker Plot)、箱线图、盒图,,因形状如箱子而得名。1977年,美国著名数学家John W. Tukey首先在他的著作《Exploratory Data Analysis》中介绍了箱形图。转载 2023-06-08 10:13:45 · 2436 阅读 · 0 评论 -
结合日常生活的例子,了解什么是卡方检验
卡方检验就是检验两个变量之间有没有关系。卡方检验可以检验男性或者女性对线上买生鲜食品有没有区别;不同城市级别的消费者对买SUV车有没有什么区别;如果有显著区别的话,我们会考虑把这些变量放到模型或者分析里去。转载 2023-06-05 16:09:38 · 133 阅读 · 0 评论 -
用可视化思维解读统计自由度
但是你只有7双鞋,所以,在礼拜一的时候,你可以在7双鞋子里随便挑一双穿,到了礼拜二,你可以在剩下的6双里面挑一双穿,到了礼拜六,只剩下2双给你挑了,过完礼拜六,只剩下一双鞋了,你只能穿这双,因为你没有其他的鞋子可以挑了。首先,你先不要想统计的知识,我们讲一个平时生活里的例子,比如你是一个非常喜欢鞋子的人,你每个礼拜每一天都想穿上不一样的鞋子,比如周一穿高跟鞋,周二穿运动鞋,等等。总结以上的例子,如果我们有r行,c列的表格,我们可以自由填写的有(r-1)(c-1)个数,这就是卡方检验的自由度计算公式。转载 2023-06-05 16:05:43 · 107 阅读 · 0 评论 -
终于有人把机器学习中的评价指标讲清楚了
在这个测试数据集中,计算的召回率R为100%,非常好,也就是说,在这个数据集里总共有10个目标,已全部找到(召回)。因此,对于每一个阈值可得到对应的一组(R,P),例如,上述的两个阈值可得出两组(R,P),分别为:(0.86,0.75)和(1,0.7)。如果取多个不同的阈值,就可以得到多组(R,P)。这其实也很好理解,前面我们说了,精度即查准率,召回率即查全率,要想查得精准(一查一个准),即模型给出的目标都正确,那就得提高阈值门槛,阈值一提高,符合要求的目标就会减少,那必然会导致漏网之鱼增多,召回率降低。转载 2023-05-10 15:42:30 · 339 阅读 · 0 评论 -
人工智能教程(二)
本实例的数据集来自kaggle网站,用了预测泰坦尼克号沉船事件的幸存者原创 2022-09-08 15:01:02 · 325 阅读 · 0 评论 -
通俗易懂的机器学习教程(强烈推荐)
有志于从事机器学习的人们可以给我留言,保证你绝不后悔。原创 2022-08-14 21:21:31 · 152 阅读 · 1 评论