python爬虫-python实现抓取腾讯视频所有电影

最新推荐文章于 2024-05-02 22:12:37 发布

Python新手学习之家

最新推荐文章于 2024-05-02 22:12:37 发布

阅读量5.9k

点赞数 3

分类专栏： python爬虫文章标签： python爬虫 python

本文链接：https://blog.csdn.net/qq_45327272/article/details/93928514

版权

用python实现的抓取腾讯视频所有电影的爬虫

# -*- coding: utf-8 -*-
import re
import urllib2
from bs4 import BeautifulSoup
import string, time
import pymongo
  
NUM     = 0         #全局变量,电影数量
m_type  = u''       #全局变量,电影类型
m_site  = u'qq' #全局变量,电影网站
  
#根据指定的URL获取网页内容
def gethtml(url):
    req = urllib2.Request(url)
    response = urllib2.urlopen(req)
    html = response.read()
    return html
'''
在学习过程中有什么不懂得可以加我的python学习交流扣扣qun，934109170，群里有不错的学习教程与开发工具。
''' 

#从电影分类列表页面获取电影分类
def gettags(html):
    global m_type
    soup = BeautifulSoup(html)      #过滤出分类内容
    #print soup
    #<ul class="clearfix _group" gname="mi_type" gtype="1">
    tags_all = soup.find_all('ul', {'class' : 'clearfix _

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Python新手学习之家

关注关注

3
点赞
踩
21

收藏

觉得还不错? 一键收藏
3
评论
python爬虫-python实现抓取腾讯视频所有电影

用python实现的抓取腾讯视频所有电影的爬虫# -*- coding: utf-8 -*-import reimport urllib2from bs4 import BeautifulSoupimport string, timeimport pymongo NUM = 0 #全局变量,电影数量m_type = u'' #全局变...
复制链接

扫一扫