以下内容有任何不理解可以翻看我之前的博客哦:吴恩达deeplearning.ai专栏
这节博客中,我们主要看看构建一个机器学习的完整周期是什么,也就是说,当你想构建一个有价值的机器学习系统时,需要考虑和计划的步骤是什么。让我们以语音识别为例。
语音识别
如果你想要开发一个语音识别的应用,那么你大致上需要以下四个步骤:
第一,你需要确定的项目到底要做些什么,比如你想做的是将用户的人声翻译成文本。
第二,你需要收集数据,从而能够构成你的数据集,为构建神经网络做准备。
第三,你需要搭建神经网络架构,训练模型,以及通过一系列模型数据对模型进行微调,包括参数,神经网络架构等等,有时候你也需要回到第二步进行补充。
第四,当你认为你的模型以及足够优秀了,那么你就可以部署你的模型了,也就是你的模型对用户开放使用了。如果条件允许,你也可以使用神经网络系统获得的新的数据对神经网络进行维持甚至优化模型性能。
前面三个步骤在之前的博客之中已经详细讲过了,今天主要讲第四个部分。
部署
首先,你首先要将你的神经网络部署到一个推理服务器上。然后,如果你的团队已经实现了一个移动应用程序,例如一个社交应用程序,那么当用户与程序进行交谈时,移动应用程序就可以进行API的调用,将录制的音频传给服务器,服务器接收到你的数据,并在神经网络上运行获得结果,再将结果传输给你的手机app。
根据你的用户规模,你可能需要不同程度的软件工程,来帮助你实现以下任务:
- 维护并保持模型的效率
- 扩展你模型的功能
- 记录用户数据并以此优化模型
- 对系统进行检测,例如随着时间有些新的人名出现了,那么需要及时重新训练模型
- 模型更新
以上步骤可能会需要多个团队来共同工作。机器学习中有个不断发展的领域叫做MLOps(Machine Learning Operations),它的意思是如何系统地构建、部署、维护机器学习系统的实践。做以上的这些事情来保证你的模型可靠,可发展并能良好运行。
在接着讲深度学习相关技术之前,分享一下有关机器学习相关伦理的问题。
公平、偏见、伦理
关于深度学习,我们必须避免出现类似以下的问题
- 雇佣软件歧视不同肤色的人种
- 人脸识别系统更倾向于将深色肤色的人识别为罪犯
- 银行借贷更偏向于借给白人
- 利用深度学习技术制作虚假消息
- 社交媒体深度学习算法加速虚假消息传播,引起恐慌,引导公众舆论
深读学习是一种工具,在使用时一定不要将其使用在危害社会的地方上!!!!
在进行一个项目之前一定要对其可能产生的负面影响以及法律风险进行评估。
为了给读者你造成不必要的麻烦,博主的所有视频都没开仅粉丝可见,如果想要阅读我的其他博客,可以点个小小的关注哦。