手把手教你用seq2seq模型创建数据产品（附代码）

最新推荐文章于 2023-09-03 11:08:18 发布

煊琰

最新推荐文章于 2023-09-03 11:08:18 发布

阅读量421

点赞数

目标：训练一个模型来对Github项目进行总结

85988cbf10a7a3932c964d2a0dac17a1f29040b1

矩形框中的是预测结果

以上只是从一系列预测结果中随机选取的元素，请继续往下读，下文包含一个带有更多示例的链接！

我有几张阿里云幸运券分享给你，用券购买或者升级阿里云相应产品会有特惠惊喜哦！把想要买的产品的幸运券都领走吧！快下手，马上就要抢光了。

ff648d78c55895cf88157ef22aafda9e31783419

Github的吉祥物章鱼猫（Octocat）

起因

我从来没有想过用“神奇的”这个词来描述机器学习技术的输出结果。但当我逐渐了解可以用于图像识别（https://machinelearningmastery.com/use-pre-trained-vgg-model-classify-objects-photographs/）或者对两吨乐高积木进行分类（https://jacquesmattheij.com/sorting-two-metric-tons-of-lego)的深度学习的时候，这一切改变了。更令人惊奇的是，你不需要一个博士学位或多年的训练来释放这些技术的力量。所有你所需要的只是：不排斥写代码、达到高中数学水平和拥有足够的耐心（http://www.fast.ai/2016/10/08/overview/）。

然而，在工业中使用深度学习技术的例子却少之又少。今天，我将与大家分享一个可复用的最简可行（https://en.wikipedia.org/wiki/Minimum_viable_product）产品，来演示使用深度学习从文本（Github Issues）中创造数据产品。

本教程将专注于使用Sequence to Sequence模型对Github issues上的文本进行概括，并将向您证明: