python爬虫之豆瓣电影评分

原创 2016年08月29日 19:07:22

想知道一部电影好不好看,豆瓣的评分还是比较靠谱的,于是,搞了搞,写了一个小爬虫:


说明文档:

1.直接讲代码保存成.py文件

2.输入你喜欢的电影,按下回车

3.显示豆瓣的电影评分

4. 按任意键退出程序;




# -*- coding: utf-8 -*-

import urllib2
import re
import sys
reload(sys)
sys.setdefaultencoding('utf8')

values = raw_input()

#data = urllib.urlencode(values)
url = 'https://www.douban.com/search?cat=1002&q='
geturl = url+values
print geturl
request = urllib2.Request(geturl)
response = urllib2.urlopen(request)
#with open('C:\\Users\\Wang Zuo\\Desktop\\test.txt', 'w') as f:
#    f.write(response.read())
content = response.read().decode('utf-8')  #得到网页内容
pattern = re.compile(r' <span class="rating_nums">(.*?)</span>')
item = re.findall(pattern,content)
if len(item) == 0 :
    print 'Did not find the data'
else:
    print '评分:'+item[0]
raw_input()


相关文章推荐

用Python爬虫爬取豆瓣电影、读书Top250并排序

概述经常用豆瓣读书的童鞋应该知道,豆瓣Top250用的是综合排序,除用户评分之外还考虑了很多比如是否畅销、点击量等等,这也就导致了一些近年来评分不高的畅销书在这个排行榜上高高在上远比一些经典名著排名还...
  • alanzjl
  • alanzjl
  • 2016年02月17日 16:34
  • 5414

python抓取豆瓣电影

工作将近半年,有一个很明显的感觉:工作很多时候不像单纯学习那样要求你掌握得多深而是要求知识面比较宽广,很多东西都会有些,至少业务是这样。当规模比较小的时候,谈性能就是耍流氓。目前工作一方面是抓取:抓取...

[python爬虫入门]爬取豆瓣电影排行榜top250

要爬取内容的是豆瓣网的电影排行top250: https://movie.douban.com/top250, 将电影名和评分爬取下来并输出, 如下图: 使用了tkinter做了简单页面首先分析要爬...

python+beautifulsoup爬取豆瓣电影TOP250

import urllib.request from bs4 import BeautifulSoup import re # 豆瓣电影top250 def __getHtml(): data ...

抓取豆瓣2016年电影/分类_python

Description嗯,这次简单点 突然很想看电影,于是就抄起了python搞了一发豆瓣的电影年度清单,顺便统计了评分排名和分类之类的。还算简单吧 16年电影都在这个链接(大概)'https:/...
  • jpwang8
  • jpwang8
  • 2017年01月20日 22:53
  • 289

使用爬虫爬取豆瓣2016电影榜单中所有电影

更多技术文章请访问我的个人博客## 爬虫每日篇—-今天使用爬虫爬取豆瓣2016电影榜上所有电影信息,本来以为豆瓣这种大社区的防御做的会很好,看到是HTTPS协议,我都准备写一大串头部去模拟用户了,没想...

Python爬虫豆瓣读书评分9分以上榜单

有了上次的经验,这次爬豆瓣读书评分9分以上榜单,链接豆瓣读书评分9分以上榜单 。  打开链接,查看网页源代码,查找我们需要的信息的字段标签,本次以书名、评分、评价人数、图片、出版社、出版日期、ISBN...

(8)Python爬虫——爬取豆瓣影评数据

利用python爬取豆瓣最受欢迎的影评50条的相关信息,包括标题,作者,影片名,影片详情链接,推荐级,回应数,影评链接,影评,有用数这9项内容,然后将爬取的信息写入Excel表中。具体代码如下:#!/...

python爬虫入门笔记:用scrapy爬豆瓣

本文希望达到以下目标: 简要介绍Scarpy使用Scarpy抓取豆瓣电影 我们正式讲scrapy框架爬虫,并用豆瓣来试试手,url:http://movie.douban.com/top250 首...

python 爬虫 豆瓣 评论及评分

借鉴了不少 hang 的博客:https://segmentfault.com/a/1190000010473819 评分: # -*- coding: utf-8 -*- """ Created o...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:python爬虫之豆瓣电影评分
举报原因:
原因补充:

(最多只允许输入30个字)