爬取jd销量最高的商品名称和评论数

最新推荐文章于 2024-07-20 23:58:17 发布

wenqiang su

最新推荐文章于 2024-07-20 23:58:17 发布

阅读量739

点赞数

分类专栏：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42681868/article/details/88056704

版权

该博客介绍了如何爬取京东网站上销量最高的商品名称及其对应的评论数量，通过详细步骤和代码实例，展示了网络爬虫在电商数据分析中的应用。

摘要由CSDN通过智能技术生成

参考博客：

https://blog.csdn.net/menghuannvxia/article/details/51333689

代码：

import requests
import re
from urllib.parse import quote
from lxml import etree
import sys


def get_jd_data(keyword):
    keyword = quote(keyword)  #解码中文
    url = "https://search.jd.com/Search?keyword={}&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&bs=1&wq={}&stock=1&psort=3&click=0".format(keyword,keyword)
    # print(url)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:65.0) Gecko/20100101 Firefox/65.0',
        'Cookie':'__jda=122270672.1551510490895255034850.1551510491.1551510491.1551510491.1; __jdb=122270672.12.1551510490895255034850|1.1551510491; __jdc=12227

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

wenqiang su CSDN认证博客专家 CSDN认证企业博客

码龄6年

74: 原创

8万+: 周排名

98万+: 总排名

10万+: 访问

: 等级

1227: 积分

12: 粉丝

18: 获赞

9: 评论

118: 收藏

私信

关注

热门文章

分类专栏

English
报错记录 1篇
文献记录 7篇
数据结构 1篇
比赛 4篇
Tensorflow2.0 11篇
前端 2篇
Pytorch 18篇
Paddle 7篇
数据库 2篇
spider 1篇
机器学习 11篇
深度学习 4篇
java 3篇
python 3篇
爬虫 2篇
大数据 3篇
数据分析 1篇
scala

最新评论

pytorch-transformers （BERT）微调
lyn_CS: 直接torch.save(model, PATH)，下次调用时直接model = torch.load(PATH)
pytorch-transformers （BERT）微调
lyn_CS: 你看一下transformers的文档，里面有说到怎么保存和加载模型。训练好的模型保存起来，就可以直接用 # Saving best-practices: if you use defaults names for the model, you can reload it using from_pretrained() if args.do_train and (args.local_rank == -1 or torch.distributed.get_rank() == 0): # Create output directory if needed if not os.path.exists(args.output_dir) and args.local_rank in [-1, 0]: os.makedirs(args.output_dir) logger.info("Saving model checkpoint to %s", args.output_dir) # Save a trained model, configuration and tokenizer using `save_pretrained()`. # They can then be reloaded using `from_pretrained()` model_to_save = model.module if hasattr(model, 'module') else model # Take care of distributed/parallel training model_to_save.save_pretrained(args.output_dir) tokenizer.save_pretrained(args.output_dir) # Good practice: save your training arguments together with the trained model torch.save(args, os.path.join(args.output_dir, 'training_args.bin'))
pytorch-transformers （BERT）微调
书屋里的咸鱼: 请问您知道训练完成后的bert怎么保存以用于其他的下游任务吗？
pytorch学习笔记-入门-定义网络
Tisfy: 深得人心，正如古人云：欲买桂花同载酒，终不是、少年游。
TF2-Wide&Deep-subclass
ctotalk: 感谢分享

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。