神经网络是人工智能研究的重要方向之一。它通过模仿生物神经系统,以大量相互连接的简单处理单元(神经元)组成网络,通过调整连接权重实现对信息的处理。
21世纪以来,GPU计算能力的提升、大数据的蓬勃发展为神经网络提供了巨大支持。2006年,Hinton团队使用深度神经网络(DNN)取得语音识别竞赛优胜,此后深度学习迅速发展。2012年,Krizhevsky等人使用CNN在ImageNet图像识别竞赛中大幅领先,证实了深度神经网络在计算机视觉方面的优势。让深度学习和神经网络成为了机器学习的主流,并在图像识别、自然语言处理等领域取得了长足的进步。
目前,神经网络已在许多领域得到广泛应用:
计算机视觉:在图像分类、目标检测、图像分割、人脸识别等任务上,卷积神经网络性能显著优于传统方法。神经网络驱动的计算机视觉技术正在重塑医学影像、自动驾驶、视频监控等行业。
自然语言处理:基于循环神经网络、注意力机制的预训练语言模型(BERT、GPT等)显著改进了机器翻译、语音识别、问答系统等性能。
其他领域:语音合成、异常检测、时间序列预测、知识图谱等任务都广泛采用了神经网络模型。
神经网络经历了从最初简单的感知机,到多层前馈网络,再到卷积网络的发展过程。早期网络存在表达能力有限、不能处理复杂特征等问题。进入21世纪,随着深度学习兴起,神经网络结构也日渐复杂。为了增强网络对不同任务的适应性,模块化设计理念应运而生。
整个神经网络的架构也从最初的层到块,然后进化到了程序化组合。