NLP实战之–螺蛳粉评论情感分析和建模分类

最新推荐文章于 2023-07-22 16:35:46 发布

浮生溪若

最新推荐文章于 2023-07-22 16:35:46 发布

阅读量2k

点赞数 2

文章标签：自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30000663/article/details/120543665

版权

本文介绍了使用自然语言处理进行螺蛳粉评论的情感分析过程，包括数据采集、清洗、情感词库构建、情感分析、数据打标签、样本均衡、特征工程和模型建立。通过情感分析得出螺蛳粉好评居多，同时探讨了特征筛选、降维和模型融合的重要性。

摘要由CSDN通过智能技术生成

NLP实战之–螺蛳粉评论情感分析和建模分类

写在前面：

本文首发于我的微信公众号。新文章首发都会在微信公众号上。

自然语言处理（Natural Language Processing）是目前人工智能的大方向之一。上一篇文章提到的两大方向，计算机视觉（CV）和自然语言处理（NLP）。啥是自然语言？人们日常使用的语言就是自然语言呐，比如汉语，英语。那为啥要对自然语言做处理呢？当然是为了让计算机“智能化”啦。计算机可不认得什么英语、汉语的，你对着计算机喊一声，它肯定不理你。所以才要把自然语言处理成计算机认得的语言。

那什么样的语言，计算机才认得？答：二进制。因为计算机只能读取并且储存0和1。所以，自然语言处理（NLP），就是把咱们人类的语言（例如汉语、英语），处理成为计算机认得的语言。处理完之后能做啥？这就涉及到NLP的应用了，这个应用范围是在是太广范了。有文本分类、机器翻译、情感分析、问答系统、对话系统、知识图谱等等。

硬核实战：

为啥选择螺蛳粉评论做分析？因为最近的一个多月螺蛳粉吃得有点上头，每天都要吃一顿，不吃不舒服。干脆，索性整点好玩的，做一下这个螺蛳粉评论。

还记得，上一篇文章的机器学习流程，跟西红柿炒番茄，啊不，是西红柿炒鸡蛋流程一样的。

机器学习：数据采集—>数据清洗—>特征工程—>数据建模。

西红柿炒鸡蛋：采集西红柿和鸡蛋—>清洗—>切西红柿、将蛋搅拌—>开炒

第一步，采集数据。

采集数据，最简单粗暴的办法，上百度找，去一些竞赛网搜，比如kaggle、和鲸社区、阿里天池。果不其然，真的有。

点进去，一看，竟然才只有两千条数据。这也太少了吧…

那我再重新去淘宝复制一些（手动复制是不可能的，当然得用爬虫啊）。干脆选一样的店铺把，我就进去李子柒淘宝店铺里面找了个螺蛳粉的，往下拉，直接看到了总评数：200万条评论。这么多，我只要一万就肯定够用了！

很快，我终于知道为什么别人的那个数据集只有两千条了。因为淘宝只能展示最近的两千条评论。也就是说，你最多只能复制最新的2千条。

最低0.47元/天解锁文章

关注

2
点赞
踩
43

收藏

觉得还不错? 一键收藏
1
评论
NLP实战之–螺蛳粉评论情感分析和建模分类

NLP实战之–螺蛳粉评论情感分析和建模分类写在前面：本文首发于我的微信公众号。新文章首发都会在微信公众号上。自然语言处理（Natural Language Processing）是目前人工智能的大方向之一。上一篇文章提到的两大方向，计算机视觉（CV）和自然语言处理（NLP）。啥是自然语言？人们日常使用的语言就是自然语言呐，比如汉语，英语。那为啥要对自然语言做处理呢？当然是为了让计算机“智能化”啦。计算机可不认得什么英语、汉语的，你对着计算机喊一声，它肯定不理你。所以才要把自然语言处理成计算机认得的语言
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。