爬虫
文章平均质量分 80
叶柖
试图会写文章
展开
-
python爬取中国天气网天气并保存为csv格式文件
python版本:python3.7 编译器:pycharm 所爬取的网址:http://www.weather.com.cn/weather/101020100.shtml (中国天气网上海) 所用方法:lxml的css选择器 lxml的具体使用方法可以参照我另一篇博客:https://blog.csdn.net/qq_38929220/article/details/83623057 最后运行...原创 2018-11-11 20:03:12 · 9915 阅读 · 0 评论 -
python爬虫爬取淘宝失败原因分析
正则表达式data = re.findall(‘g_page_config = (.*?)g_srp_loadCss’, html,re.S)[0] 报错out of range 去掉[0]后输出,只输出了一个空列表,发现其实并没有抓取到网页信息,空列表里取首元素就出现了out of range的错误。 输出html后发现代码和网页源代码不相同,没有应有的商品信息。 大概有两种可能 淘宝页面异步...原创 2018-10-20 15:50:03 · 15300 阅读 · 3 评论