之前看到大数据文摘 我们扒下了全网所有“年夜饭”菜谱,找到了最有年味的一道菜 的一文,对于菜谱数据分析产生了浓厚的兴趣,遂自己也写了个爬虫爬取了某美食网站的一些精选菜谱和食材信息。
当看到这些美味佳肴的数据源源不断入库时,我旺盛的好奇心一下子被激发了起来:
- 世界菜系琳琅满目,能不能从数据中挖掘出它们的特色?
- 能不能从大数据中得到大家对美食口味的特别偏好?
- 若是我自己找到甚至做了一道菜,能不能自动判断它的菜系,甚至给它打分?
我相信丰富的数据挖掘和机器学习方法将能够满足我的好奇心,现在就动手进行探索吧:
菜系特色
我认为菜系的特色食材应该是一个菜系能够用来区别于其他菜系的特殊食材。
我想到,机器学习中的分类方法正好可以帮助我们挖掘出这些区分性的特征