Python爬虫实现抓取腾讯视频所有电影-源码【实战必学】

用python实现的抓取腾讯视频所有电影的爬虫

1.  # -*- coding: utf-8 -*-

2.  import re

3.  import urllib2

4.  from bs4 import BeautifulSoup

5.  import string, time

6.  import pymongo

8.  NUM = 0 #全局变量,电影数量

9.  m_type = u'' #全局变量,电影类型

10.  m_site = u'qq' #全局变量,电影网站

12.  #根据指定的URL获取网页内容

13.  def gethtml(url):

14.  req = urllib2.Request(url)

15.  response = urllib2.urlopen(req)

16.  html = response.read()

17.  return html

18.  '''

19.  在学习过程中有什么不懂得可以加我的python学习交流扣扣qun,784758214,群里有不错的学习教程与开发工具。

20.  '''

22.  #从电影分类列表页面获取电影分类

23.  def gettags(html):

24.  global m_type

25.  soup = BeautifulSoup(html) #过滤出分类内容

26.  #print soup

27.  #<ul class="clearfix _group" gname="mi_type" gtype="1">

28.  tags_all = soup.find_all('ul', {'class
  • 8
    点赞
  • 67
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值