python 微信推文图片提取，并打包压缩

最新推荐文章于 2023-05-27 07:59:14 发布

onlyforbest

最新推荐文章于 2023-05-27 07:59:14 发布

阅读量398

点赞数

分类专栏： python 小工具方法

本文链接：https://blog.csdn.net/onlyforbest/article/details/108240017

版权

python 小工具方法专栏收录该内容

22 篇文章 0 订阅

订阅专栏

from re import findall
from urllib.request import urlopen
import os,shutil
import zipfile
def makedir(path):
  os.chdir("/")
  isExists=os.path.exists(path)
  if isExists:
    shutil.rmtree(path)
  else:
    os.mkdir(path)

def getwechatimg(idx,url):
  path="/content/sample_data/wechat"+str(idx)
  makedir(path)
  os.chdir(path)
  # url = input()
  with urlopen(url) as fp:
    content = fp.read().decode()
  pattern = 'data-src="(.+?)"'
  result = findall(pattern, content)
  for index, item in enumerate(result):
    if item.endswith("jpeg"):
      with urlopen(str(item)) as fp:
        with open(str(index)+'.jpeg', 'wb') as fp1:
          fp1.write(fp.read())

  z = zipfile.ZipFile("/content/sample_data/download_"+str(idx)+".zip", 'w', zipfile.ZIP_DEFLATED)
  startdir = path
  for dirpath, dirnames, filenames in os.walk(startdir):
    fpath = path.replace(dirpath,'')
    for filename in filenames:
      z.write(os.path.join(fpath, filename))
  z.close()
  shutil.rmtree(path)

'''items 引号内添加文章链接'''
items=["",""]
for index,item in enumerate(items):
  getwechatimg(index,item)