新下载的海盗湾文件包内有torrent文件和index索引文件。但通过对比发现,torrent文件数量要少于index文件,由于index文件里面包含磁链接地址,每个磁链接地址可以下载一个torrent文件,因此我们可以把index文件里面的磁链接整理出来,方便日后的查询。
第一步,解压海盗湾的压缩包,把里面的torrent文件删除掉,再重新打包成tar.gz包。
第二步,送进linux虚拟机里面,解压。
第三步,处理index文件并将结果导出成一个1.sql文件。在这里 我用了一个脚本来处理:
find . -type f -name "*.index"|while read file;
do
title=`grep "\[Title\]" "$file"|tr -d '\n'`
torrent=`grep "\[Magnet\]" "$file"`
title=`expr substr "$title" 15 2048`
torrent=`expr substr "$torrent" 15 2048`
printf "%s\t%s\n" "$title" $torrent >>1.sql
done
第四步,导入mysql数据库, LOAD DATA LOCAL INFILE '/home/data/1.sql' INTO TABLE haidao;