近期搭建电影服务器,使用免费的电影系统,不提供自动更新电影和电影信息的功能,电影下载入库后手动添加电影信息实在太费时间。所以现学现用,用python拼凑了个脚本自动获取电影信息添加到系统数据库。脚本如下,其中很大部分代码搬运于http://www.oschina.net/code/snippet_727111_15804 的帖子,特此感谢。
基本实现了需求的功能,还有一些遗留问题待研究,望大神们赐教:
1. 通过电影名字在豆瓣中寻找subject_id所使用的方法不一定能都找到所有预期的结果,需要寻找更好的办法
2. python对于字符编码貌似特别敏感,比较晕,比如这个脚本要重定向输出到文件中就不可行
#coding:utf-8
import sys, re, urllib, json, win32com.client, time
def GetMovieInfo(movie_id,movie_name):
#获取电影在豆瓣中的subject_id
#id_search_url = "http://movie.douban.com/subject_search?search_text="+movie_name+"&cat=1002