from email.mime.multipart import MIMEMultipart
Next_page(url)
函数
此函数用于分析提取收藏文章分页地址、实现方式很简单、通过
for
循环提供
N
多的分页地址进去、然后用
"
正则表达式
"
去匹配内容、如果内容存在即认
为分页地址正确、然后把地址添加到列表中、如果
"
正则表达式
"
返回
None
说明内容匹配失败、此地址不是正确的分页地址。循环结束。
具体代码如下
def Next_page(url):
"""
接收用户输入的知乎收藏页面地址、提取所有分页的
url
地址存入列表中
通过正则表达式匹配内容并提取出来所有分页地址的
url
@url_list_regex :
提取
URL
规则、如果为空说明本页已没收藏的文章
@page_url :
用于存放所有分页
url
"""
url_list_regex = r"(
)(.*)(
)"global page_url
page_url = []