python 下载网页内容包括图片_python完成网页下载（包括图片和css） | 学步园

最新推荐文章于 2024-05-17 22:16:17 发布

weixin_39880150

最新推荐文章于 2024-05-17 22:16:17 发布

阅读量221

点赞数

文章标签： python 下载网页内容包括图片

本文链接：https://blog.csdn.net/weixin_39880150/article/details/111800740

版权

import urllib2

import os

from bs4 import BeautifulSoup

import re

siteUrls = " "

url = "http://www.sina.com.cn"

def getContent(url):

content = urllib2.urlopen(url).read()

content = writeCss(url,content)

content = writefileName(url,content)

fileNames = re.findall(r'/[^\?]*\?([^/|^\?]*)$',url)

fileName = fileNames[0]

print fileName

f = file(fileName+".html",'w')

f.write(content)

f.close()

def writeCss(url,content):

soup = BeautifulSoup(content)

csss = soup.findAll('link',attrs={'type':'text/css'})

css_pat = re.compile('.*/(.*)\.css')

fileNames = re.findall(r'/[^\?]*\?([^/|^\?]*)$',url)

fileName = fileNames[0]

print fileNam

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注