判菜系、调众口、打分数,这一回,我们用大数据烧菜?

作者通过爬取美食网站数据,运用机器学习方法分析菜系特色、菜谱评分和口味偏好。逻辑回归和XGBoost模型分别用于识别菜系和预测评分。结果显示,川菜以郫县豆瓣为特色,口味偏好上,人们更倾向于香辣鲜美。
摘要由CSDN通过智能技术生成

之前看到大数据文摘 我们扒下了全网所有“年夜饭”菜谱,找到了最有年味的一道菜 的一文,对于菜谱数据分析产生了浓厚的兴趣,遂自己也写了个爬虫爬取了某美食网站的一些精选菜谱和食材信息。
在这里插入图片描述

当看到这些美味佳肴的数据源源不断入库时,我旺盛的好奇心一下子被激发了起来:

  • 世界菜系琳琅满目,能不能从数据中挖掘出它们的特色?
  • 能不能从大数据中得到大家对美食口味的特别偏好?
  • 若是我自己找到甚至做了一道菜,能不能自动判断它的菜系,甚至给它打分?

我相信丰富的数据挖掘和机器学习方法将能够满足我的好奇心,现在就动手进行探索吧:

菜系特色

我认为菜系的特色食材应该是一个菜系能够用来区别于其他菜系的特殊食材。

我想到,机器学习中的分类方法正好可以帮助我们挖掘出这些区分性的特征

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值