在爬数据的过程中,需要将爬取的数据存起来,方便以后的分析,但是由于是直接保存为CSV格式
,并且Robomongo
中没有直接导入的便捷方式,这里将教大家如何导入文件到数据库
1.进入mongodb安装目录
如果没有配置系统环境的话,就需要进入到安装目录才能进行下面的步骤,如果已经配置好,可以直接输入下面的命令
2.输入指令
mongoimport -d doubantop250 -c movie –type csv –headerline –file D:\pycharm\PycharmProjects\doubanmovie\movie.csv
由于我爬取的数据存在D:\pycharm\PycharmProjects\doubanmovie\movie.csv
所以你需要修改相对应的路径,并且数据库名doubantop250
也需要改为你想要存放的数据库
3.参数说明
-type:指明要导入的文件格式
-headerline:指明第一行是列名,不需要导入
-file:指明要导入的文件