标题第一天学习:用Python 获取网络数据 (爬取)
追溯源泉:
资料:
1-requests状态码集合
418:(‘im_a_teapot’, ‘teapot’, ‘i_am_a_teapot’)
解释:就是你爬取的网站有反爬虫机制,需要添加请求头:headers;
为什么要加 headers呢?
因为 headers是解决反爬虫的方法之一,就是伪装一下说自己不是爬虫啦!
怎么找url、headers 和 cookie ?
追溯源泉:
资料:
1-requests状态码集合
418:(‘im_a_teapot’, ‘teapot’, ‘i_am_a_teapot’)
解释:就是你爬取的网站有反爬虫机制,需要添加请求头:headers;
为什么要加 headers呢?
因为 headers是解决反爬虫的方法之一,就是伪装一下说自己不是爬虫啦!
怎么找url、headers 和 cookie ?