- 博客(1)
- 收藏
- 关注
原创 语记app图文内容爬取,并保存为Word(Python)
1、工具:Python+selenium+Docx2、实现步骤: ① 模拟登陆语记; ② 利用日期(年月,例如201909)去定位要抓取的内容;(这里需要控制好内容列表的滚动条和翻页) ③ 利用正则表达式获取正文内容,这里注意iframe框和图片的获取需要提供cookie; ④ 最后保存到word中。如下图(每月内容保存一个word) ...
2019-03-13 17:21:43 441
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人