imdb数据集下载
github 链接
wget ftp://ftp.fu-berlin.de/misc/movies/database/frozendata/*gz
速度可能较慢,需要耐心等待
imdbpy安装
imdbpy 需要安装Python3和mysqlclient
sudo apt install python3
pip3 install PyMySQL
pip3 install sqlalchemy
在github上下载imdbpy安装包,解压文件
unzip 6.8.zip
进入解压后的文件目录安装imdbpy
python3 setup.py install
imdb数据集导入
imdbpy导入IMDB数据集方法
在要导入IMDB的数据集上新建数据库实例
create database databasename;
进入解压后的文件目录,找到imdbpy2sql.py,此文件在bin目录下,执行如下命令
python3 imdbpy2sql.py -d [imdb_dataset_directory] -u ‘mysql://user:password@localhost/databasename’
例如: python3 imdbpy2sql.py -d /home/guomiaomiao/桌面/data -u ‘mysql://root:1234567890@localhost/imdb’
导入时间可能会很长,请耐心等待
可能会遇到问题
File “/home/guomiaomiao/anaconda3/envs/imdbInstall/lib/python3.9/site-packages/sqlalchemy/dialects/mysql/mysqldb.py”, line 118, in dbapi
return import(“MySQLdb”)
ModuleNotFoundError: No module named ‘MySQLdb’
解决方案:
打开对应文件
添加代码
import pymysql
pymysql.install_as_MySQLdb()
例如:
@classmethod
def dbapi(cls):
import pymysql
pymysql.install_as_MySQLdb()
return import(“MySQLdb”)