自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

yiyadayan的博客

一个人的空间

爬虫

关注

关注数：文章数：1 文章阅读量：1248 文章收藏量：3

作者: 一嗒嗒

持之以恒，方能不败。少说多做，今日毕

展开

爬虫遇到的问题汇总

1. 注意xpath很重要， # x_path的位置十分重要,根目录一定要写对 xpath_urls = '//div[@class="fff-product-detail"]/a' # 获取所有的目录下的源码 urls_pre = browser.find_elements_by_xpath(xpath_urls) 2. 网址的重定向问题，注意爬取的页面很可能是重定向过的网址，需要去除重定向 def get_real_url(fake_url,try_count =

原创 2020-08-20 15:17:25 · 1248 阅读 · 0 评论