NLP判断语言情绪_产品经理也能动手实践的AI（五）- IMDB电影评论NLP，协同过滤...

weixin_39621235

于 2020-11-22 00:31:59 发布

阅读量173

点赞数

文章标签： NLP判断语言情绪

上一节讲了多标签识别，图像分割和data block，这之前讲的都是图像识别的方法，今天一节课把剩下的3种核心领域都讲了：自然语言处理，表格数据处理，协同过滤，并且把神经网络层与层之间的微观活动也都详细的描述了一遍，可谓是干货满满。

1.概览

首先是自然语言处理 NLP(Natural Language Processing )，主要讲解通过迁移学习来实现IMDB评论的正负面情绪分辨；
然后是根据个人信息的数据，预测哪些人可以获得高薪；
最后是协同过滤，在用户喜欢了一些电影之后，可以预测某个他没看过的电影是否会喜欢。

2.1核心流程

NLP - IMDB情绪分析大概需要3步，建立宏观的语言模型，利用的是Wikipedia的数据训练的模型；然后是根据IMDB的数据训练定向的电影行业语言模型；最后是用训练好的语言模型，训练一个正负面情绪的分类器。

表格数据处理-薪资预测：主要是把类别变量转化成连续变量，比如职业、婚姻情况等……会转化成0，1，2这样的数字；然后通过processor进行预处理，然后就可以训练了。

协同过滤-推荐喜欢的电影：流程都一样，只不过使用特殊类型的CollabDataBunch，以及特殊的collab_learner。

2.2核心机器学习概念

参数 weights/parameters：用于计算的参数/权重矩阵
激活 activations：计算后的结果，包含矩阵运算后的结果和激活函数运算后的结果
激活函数 activation functions：一般是ReLU函数，只改变内容不改变size

3.1实例详细分析(NLP)

建立宏观的语言模型，利用的是Wikipedia的数据训练的模型(Wikitext 103)；

"I'd like to eat a hot ___":
Obviously, "dog

weixin_39621235

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。