python continue outside loop_【经验讨论】python的requests请求参数为None出错

最新推荐文章于 2022-09-03 16:44:57 发布

weixin_39908758

最新推荐文章于 2022-09-03 16:44:57 发布

阅读量306

点赞数

文章标签： python continue outside loop

[Python] 纯文本查看复制代码import jsonimport re

import requests

from urllib.parse import urlencode

from bs4 import BeautifulSoup

from requests.exceptions import RequestException

def get_page_index(offset,keyword):

data = {

'offset': offset,

'format': 'json',

'keyword': keyword,

'autoload':'true',

'ount': '20',

'cur_tab': 1 ,

'from':'search_tab'

}

url = 'https://www.toutiao.com/search_content/?' + urlencode(data)

response = requests.get(url)

try:

if response.status_code ==200:

return response.text

return None

except RequestException:

print('get failed!')

return None

def parse_ge_index(html):

data = json.loads(html)

if data and 'data' in data.keys():

for item in data.get('data'):

yield item.get('article_url')

def get_page_detail(url):

if url == 'http://None':

return None

response = requests.get(url)

if response.status_code == 200:

return response.text

return None

def parse_page_detail(html):

soup = BeautifulSoup(html,'lxml')

title = soup.select('title')[0].get_text()

image_pattern = re.compile('gallery: JSON.parse(.*?);',re.S)

result = re.search(image_pattern,html)

if result:

print(result.group(1))

def main():

html = get_page_index(0,'街拍')

for url in parse_ge_index(html):

print(url)

html = get_page_detail(url)

if __name__ == '__main__':

main()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39908758

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python continue outside loop_【经验讨论】python的requests请求参数为None出错

[Python] 纯文本查看复制代码import jsonimport reimport requestsfrom urllib.parse import urlencodefrom bs4 import BeautifulSoupfrom requests.exceptions import RequestExceptiondef get_page_index(offset,keyword):...
复制链接

扫一扫