读取CSV
你好!我好!
这是第一篇博客,在个人网站没有建起来之前,现在CSDN发一些值得总结的学习笔记(ROS\DL…)
这篇主要是学习关于Titanic的准备工作。包括如何读取data等
找到CSV
从Notebook给出的代码可以看到:
for dirname, _, filenames in os.walk('/kaggle/input'):
for filename in filenames:
print(os.path.join(dirname, filename))
这段代码打印出了所有的data的路径。主要遍历手段是os.walk
那么os.walk是什么?
这篇给出了一个形象的图片
可以看到os.walk返回了一个元组,他将每一层的文件和文件夹分开存放。优先在每一个孩子节点下遍历到底。(深度优先???
而Titanic的data比较简单,全都在/kaggle/input下,所以结果便是
/kaggle/input/titanic/train.csv
/kaggle/input/titanic/test.csv
/kaggle/input/titanic/gender_submission.csv
而通常,遍历文件的时候,常使用如下代码:
for parent, dir_names, file_names in os.walk(person_dir):
for file_name in file_names:
print file_name
Notebook的写法用 _ 隐去了dir_names
读取CSV
那么找到了CSV的位置,我又该如何读取它呢?