我就去kaggle上瞄了一眼
打开了新世界的大门!
kaggle上有世界各国网友提供的数据集
https://www.kaggle.com/datasets
我这次选了个葡萄酒评分的数据
下载下来之后
内容是这样的
一共有150929条记录
数据集的描述是这样的:
在观看Somm(侍酒师纪录片)之后,数据及提供者想知道如何创建一个预测模型,通过像侍酒师那样的盲品来鉴别葡萄酒。 第一步是收集一些数据来训练一个模型。 他打算根据品酒的描述/评论中使用的单词利用深度学习来预测葡萄酒品种。 该模型虽然不能品尝葡萄酒,但理论上可以基于侍酒师可以给出的描述来识别葡萄酒。
小编百度了一下Somm的影片信息如下:
我们看看各字段含义:
评分(Points):评分为1-100
品种(Variety):用来制作葡萄酒的葡萄品种
描述(Description):侍酒师的几句话描述酒的味道,气味,外观,感觉等。
国家(Co