使用python和selenium实现的taobao网站爬虫

最新推荐文章于 2024-07-25 19:59:32 发布

bluecrest

最新推荐文章于 2024-07-25 19:59:32 发布

阅读量466

点赞数 1

文章标签： python 爬虫淘宝 webdriver selenium

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/projecinfo/article/details/89209700

版权

代码下载

https://github.com/bluecrest8/taobao

taobao.py中修改xxxx为你的账户名称。

启动后扫描qrcode后开始下载网站店铺宝贝，存储到sqlite3 db。

market1.cfg是配置文件

db = .\db\market.db //数据库的位置，会自动生成
shop = market.txt //店铺的链接地址淘宝和天猫都可以
times = 201904010900 //用来表示你是哪一天抓的数据
start_page = 1 //1表示从第一页开始抓
page_count = 10 //表示总共抓10页
driver = .\driver\chromedriver.exe //表示你使用的webdriver，可以是fireforx，ie
begin = 2019-03-30 22:09:07 //记录开始抓的时间
current_page = 0 //表示结束时抓到第几页
end = 2019-03-30 22:19:09
update_goods = 0
goods_detail = 0 //1表示不仅仅抓所有宝贝的销量和价格，还要点进去每一个宝贝抓取他的收藏数和评论数

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

bluecrest CSDN认证博客专家 CSDN认证企业博客

码龄23年

24: 原创

34万+: 周排名

36万+: 总排名

7万+: 访问

: 等级

884: 积分

4: 粉丝

2: 获赞

9: 评论

2: 收藏

私信

关注

热门文章

分类专栏

Brew

最新评论

CSDN Browser
jet: How can I dowload it, please?
TCP网络程序设计-完成端口之应用
youhean: 我也要一份源代码
Step By Step 可连接对象与接受器实现
卧龙: 代码可以发给我么 <br>我的邮箱是jywu8910@126.com <br>有个问题问一下，我觉得代理和残根DLL一般是2个不同的DLL，分别实现不同的通信功能，您这里写的一个是代理DLL吧，还是代理和残根DLL在本质上是相同的，就实现内容不同？ <br>怎么Sink要生成EXE 文件？应该也是DLL才对啊，我是初学，不是很懂，可不可以解释一下
Step By Step 可连接对象与接受器实现
卧龙: 可以给一下代码么，你的油箱是？
TCP网络程序设计-完成端口之应用
楼主我也需要一份，能给我一分份？: 谢谢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。