这里不讨论加载常用的公用数据集,而是讨论加载自己的原始数据(即,实际中遇到的数据)
http://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_files.html
加载文本文件存储的数据集,其中不同类别的文件存放路径为:
container_folder/-
category_1_folder/
- file_1.txt file_2.txt ... file_42.txt category_2_folder/
- file_43.txt file_44.txt ...
其中,