下载GHTorrent数据:打开链接http://www.ghtorrent.org/,点击菜单栏”Downloads“,选择数据版本并下载,我选的是当前最新版本2018-11-01,压缩包大约85GB+,解压缩后300GB+,提醒大家提前预备号足够的空间。
注意:GHTorrent中的文件需要在linux系统下操作,你也可以在windows下安装虚拟机,怎样都行,我是选择安装的双系统。而且由于我的GHTorrent数据是在安装ubuntu双系统前下载的,所以我现在是在ubuntu系统下操作windows系统的文件。而且到现在为止还没出现问题,所以有同样困惑的小伙伴不用担心了。
由于是第一次接触GitHub以及MySQL,所以一切都是陌生的,每一个步走的都如履薄冰,因此把我走的路整理下来记录怕自己忘了,也顺便分享给大家。
再次强调是在ubuntu系统下操作的
操作步骤:
1. 在终端下定位到GHTorrent数据所在路径,我的路径是/media/liubc/Data/GHTorrent_Dataset/mysql-2018-11-01/mysql-2018-11-01/
2. 进入mysql模式:命令‘mysql -uroot -p’ 这里会提示你输入密码
3. 创建用户gtuser,并设置其密码为1111,使其能够访问创建的gt_restore数据库。命令依次为:
(注意