2024 批量下载公众号文章，导出html和pdf，还有excel数据包含阅读数/点赞数/留言数/粉丝数等

最新推荐文章于 2025-01-10 17:15:47 发布

苏生不惑

最新推荐文章于 2025-01-10 17:15:47 发布

阅读量320

点赞数 3

分类专栏：工具 Python 文章标签： html pdf excel

本文链接：https://blog.csdn.net/sushengbuhuo/article/details/136755375

版权

工具同时被 2 个专栏收录

79 篇文章

订阅专栏

Python

53 篇文章

订阅专栏

之前分享过批量下载公众号文章导出html2023 更新版：苏生不惑开发过的那些原创工具和脚本，然后用pyppeteer转换html为pdf ，最近pip install -U pyppeteer 升级版本后发现不能用了，这里分享下解决方案，提示Starting Chromium download，要重新下载对应chromium:

[INFO] Starting Chromium download.
Traceback (most recent call last):
  File "htmltopdf.py", line 95, in <module>
    asyncio.get_event_loop().run_until_complete(main())
  File "E:\anaconda\lib\asyncio\base_events.py", line 642, in run_until_complete
    return future.result()
  File "htmltopdf.py", line 16, in main
    browser = await launch()
  File "E:\anaconda\lib\site-packages\pyppeteer\launcher.py", line 307, in launch
    return await Launcher(options, **kwargs).launch()
  File "E:\anaconda\lib\site-packages\pyppeteer\launcher.py", line 120, in __init__
    download_chromium()
  File "E:\anaconda\lib\site-packages\pyppeteer\chromium_downloader.py", line 138, in download_chromium
    extract_zip(download_zip(get_url()), DOWNLOADS_FOLDER / REVISION)
  File "E:\anaconda\lib\site-packages\pyppeteer\chromium_downloader.py", line 82, in download_zip
    raise OSError(f'Chromium downloadable not found at {url}: ' f'Received {r.data.decode()}.\n')
OSError: Chromium downloadable not found at https://storage.googleapis.com/chromium-browser-snapshots/Win_x64/1181205/chs not exist.</Message><Details>No such object: chromium-browser-snapshots/Win_x64/1181205/chrome-win.zip</Details></Error>.

下载哪个版本的chromium可以使用如下代码：

import pyppeteer.chromium_downloader
PYPPETEER_CHROMIUM_REVISION = '1263111'
print('版本：{}'.format(pyppeteer.__chromium_revision__))
print('文件路径：{}'.format(pyppeteer.chromium_downloader.chromiumExecutable.get('win64')))
print('下载链接：{}'.format(pyppeteer.chromium_downloader.downloadURLs.get('win64')))

版本：1181205
文件路径：C:\Users\xxx\AppData\Local\pyppeteer\pyppeteer\local-chromium\1181205\chrome-win\chrome.exe
下载链接：https://storage.googleapis.com/chromium-browser-snapshots/Win_x64/1181205/chrome-win.zip  https://pan.quark.cn/s/330b0d5d2d10

可是https://storage.googleapis.com/chromium-browser-snapshots/Win_x64/1181205/chrome-win.zip 这个文件被删了，搜了下https://stackoverflow.com/questions/78023508/pyton-request-html-is-not-downloading-chromium，用1263111版本就行 https://storage.googleapis.com/chromium-browser-snapshots/Win_x64/1263111/chrome-win.zip ，下载后解压到C:\Users\xxx\AppData\Local\pyppeteer\pyppeteer\local-chromium新建的目录1181205 ，mac版本在这里找https://commondatastorage.googleapis.com/chromium-browser-snapshots/index.html 。