url中经常要自定义关键字、页码等信息,通过以下方式可以自动组合成url形式。
from urllib.parse import urlencode
base_url = 'http://weixin.sogou.com/weixin?'
def get_index(keyword, page):
data = {
'query': keyword,
'type': 2,
'page': page
}
queries = urlencode(data)
url = base_url + queries #最后的url是http://weixin.sogou.com/weixin?query=keyword&type=2&page=page
html = get_html(url)
return html