【python】自动获取豆瓣电影信息

本文介绍了一个使用Python编写的脚本,该脚本从豆瓣电影自动获取电影信息,如导演、演员、简介等,并将这些信息更新到Access数据库中的电影系统。脚本中涉及到网页抓取、JSON解析以及数据库操作,旨在解决手动添加电影信息的效率问题。
摘要由CSDN通过智能技术生成

        近期搭建电影服务器,使用免费的电影系统,不提供自动更新电影和电影信息的功能,电影下载入库后手动添加电影信息实在太费时间。所以现学现用,用python拼凑了个脚本自动获取电影信息添加到系统数据库。脚本如下,其中很大部分代码搬运于http://www.oschina.net/code/snippet_727111_15804 的帖子,特此感谢。

        基本实现了需求的功能,还有一些遗留问题待研究,望大神们赐教:

        1. 通过电影名字在豆瓣中寻找subject_id所使用的方法不一定能都找到所有预期的结果,需要寻找更好的办法

        2. python对于字符编码貌似特别敏感,比较晕,比如这个脚本要重定向输出到文件中就不可行

 

#coding:utf-8
import sys, re, urllib, json, win32com.client, time

def GetMovieInfo(movie_id,movie_name):
    #获取电影在豆瓣中的subject_id
    #id_search_url = "http://movie.douban.com/subject_search?search_text="+movie_name+"&cat=1002

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值