【深度学习解惑】GoogLeNet 相比传统 VGG-16，参数量减少了多少数量级？其主要“省参数”手段是什么？

云博士的AI课堂

于 2025-05-05 16:36:37 发布

阅读量307

点赞数 12

分类专栏：大模型技术开发与实践深度学习哈佛博后带你玩转机器学习文章标签：深度学习人工智能 Inception GoogLeNet 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/l35633/article/details/147719374

版权

哈佛博后带你玩转机器学习同时被 3 个专栏收录

247 篇文章

订阅专栏

大模型技术开发与实践

242 篇文章

订阅专栏

186 篇文章

订阅专栏

GoogLeNet vs. VGG-16 参数量对比与核心技术解析

1. 参数量减少数量级

VGG-16：约 138 million 参数（1.38 × 10⁸）。
GoogLeNet：约 6.8 million 参数（6.8 × 10⁶）。
对比：参数量减少 约 20 倍（属于 1 个数量级的差距）。

2. 主要“省参数”手段：Inception 模块与 1×1 卷积

GoogLeNet 的核心创新是 Inception 模块，通过以下设计减少参数：

1×1 卷积降维：减少输入通道数，降低后续卷积操作的参数量。
多尺度并行卷积：并行使用不同尺寸的卷积核（1×1、3×3、5×5），提升特征表达能力。
全局平均池化：替代全连接层，减少参数冗余。

3. 代码示例：1×1 卷积的参数量优化

以下对比普通卷积与 Inception 模块的参数量差异：

场景 1：普通 5×5 卷积

import torch.nn as nn

# 输入：256 通道 → 输出：128 通道，5×5 卷积
conv = nn.Conv2d(256, 128, kernel_size=5, padding=2)
print("参数量:", 256 * 5 * 5 * 128)  # 输出: 819,200

场景 2：Inception 模块（1×1 降维 + 5×5 卷积）

# 输入：256 通道 → 1×1 降维到 32 通道 → 5×5 卷积到 128 通道
conv1x1 = nn.Conv2d(256, 32, kernel_size=1)
conv5x5 = nn.Conv2d(32, 128, kernel_size=5, padding=2)

# 总参数量
params_1x1 = 256 * 1 * 1 * 32     # 8,192
params_5x5 = 32 * 5 * 5 * 128     # 102,400
print("总参数量:", params_1x1 + params_5x5)  # 输出: 110,592（减少 87%！）

4. 未来建议

模型轻量化：结合深度可分离卷积（如 MobileNet）进一步压缩参数量。
自动化架构搜索：利用 NAS（Neural Architecture Search）优化 Inception 模块结构。
跨模型融合：将 Inception 思想与残差连接（如 ResNeXt）结合，平衡性能与效率。
边缘计算部署：在移动端使用轻量级 Inception 变体（如 ShuffleNet）。

通过 1×1 卷积降维 和 模块化设计，GoogLeNet 在保持性能的同时大幅减少参数，为轻量化模型提供了经典范式。
【哈佛博后带小白玩转机器学习】

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。