今天看到一道数学建模竞赛题,题目给了1284种食物的成分(附件1),和部分已知类别食物word(附件2),里面有三个种类的部分食物,要求根据已知食物分类来预测未知分类的食物寒热属性.
要做分类,需要用机器学习模型来训练已知类别数据,肯定是要先在附件1找到已知分类的食物,并且标注它的类别。
百度了好久,没找到相应的方法和代码。(可能是我搜索的关键词不对-_-)
题目的一小问
附件1部分数据样式附件二数据样式
于是我自己想到了下面的方法,可能有点笨。。。
1、先把word的3个食物分类分别复制在3个txt文件中
2、读取附件1中的数据,转化为DataFrame格式,在末尾