python+django基于大数据的餐饮美食食物推荐系统

qq840612233

于 2023-02-03 17:28:07 发布

阅读量1.2k

点赞数 1

文章标签： python 美食开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq840612233/article/details/128872789

版权

本应用采集目前的下厨房网站的食谱内容，对本周最受欢迎的食谱和新秀食谱进行爬取，对采集获得的食物制作方法数据进行初步处理，得到原始文本的食谱数据，包含了脱敏处理后的食谱名称、用料、做法、时间,食物图片等内容，根据分析的需要，从数据中抽取出“具体做法”一列。
（2）数据预处理：
原始数据中存在异常值、重复值、系统自动推荐等数据，这部分数据价值含量低、数据结构混乱，严重影响数据挖掘模型的执行效率，导致挖掘结果的偏差，所以进行数据清洗是必不可少的。结合原始数据的具体情况，数据预处理采用文本去重、机械压缩去词和短句删除。
（3）中文分词及用户关注点：
中文分词是将句子中汉字按照序列切成一个个单独的中文词语，结巴词库提供了精确模式、全模式和搜索引擎模式三种分词模式，是Python中一个重要的第三方中文分词函数库。Jieba词库能够支持中文简体和繁体，在分析用户评论中能够对文本评论数据提取关键词。
用户关注点是用户对某一商品特定属性的关注点，反映客户在某种商品上的聚焦点，关注某一特性的用户数量越高，说明该商品的这一属性对用户来说越重要，一般是食谱标题、所用原料、具体做法、食物图片。分析利用Jieba词库，结合用户用词习惯，设置以“家常菜”、“快手菜”、“下饭菜”、”早餐”、“减肥”、“烘焙”、“小吃”、“汤羹”八个为用户常关注的属性。

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
python+django基于大数据的餐饮美食食物推荐系统

分析利用Jieba词库，结合用户用词习惯，设置以“家常菜”、“快手菜”、“下饭菜”、”早餐”、“减肥”、“烘焙”、“小吃”、“汤羹”八个为用户常关注的属性。本应用采集目前的下厨房网站的食谱内容，对本周最受欢迎的食谱和新秀食谱进行爬取，对采集获得的食物制作方法数据进行初步处理，得到原始文本的食谱数据，包含了脱敏处理后的食谱名称、用料、做法、时间,食物图片等内容，根据分析的需要，从数据中抽取出“具体做法”一列。结合原始数据的具体情况，数据预处理采用文本去重、机械压缩去词和短句删除。
复制链接

扫一扫

qq840612233

CSDN认证博客专家 CSDN认证企业博客

码龄12年

1277: 原创

6505: 周排名

1647: 总排名

50万+: 访问

: 等级

1万+: 积分

3911: 粉丝

4513: 获赞

49: 评论

5210: 收藏

私信

关注

热门文章

最新评论

nodejs+vue.js+ElementUi论文期刊文献投稿系统
ha_lydms: 这篇博客让我看到了新的世界，感受到了新的思想。我觉得自己受益匪浅！
前后端分离vue-springboot企业员工工资管理系统 76388
daisy239: 可以求源代码吗
springmvc+mybatis医院体检预约系统springboot+jsp
ha_lydms: 非常喜欢这篇博客！博主的写作风格简洁明了，让人一目了然。文章内容丰富，涵盖了很多实用的知识点，对我来说非常有帮助。尤其是博主在文章中提供了很多实际操作的步骤和技巧，让我能够更好地应用所学的知识。同时，博主的配图也很精美，更加生动地展示了文章中的内容。总之，非常感谢博主的分享，期待博主能够继续输出这样优质的好文。
python_django_flask医疗健康咨询平台
ha_lydms: 作者的见解总是能够给我带来全新的启示，让我对于世界有了更深的理解。
python_django毕业生就业信息网站的flask设计与实现
普通网友: 写的很好！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。