python爬虫爬取京东商品信息(1)

最新推荐文章于 2024-05-06 21:40:02 发布

班力勤

最新推荐文章于 2024-05-06 21:40:02 发布

阅读量784

点赞数 27

分类专栏：程序员文章标签： python 爬虫开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_76323084/article/details/138032772

版权

程序员专栏收录该内容

193 篇文章 0 订阅

订阅专栏

for item in range(len(title_label)):

self.write_sheet.write(0, item, label=title_label[item])

写入内容

def write_content(self, content):

for item in range(len(content)):

self.write_sheet.write(self._current_row, item, label=content[item])

插入完一条记录后，换行

self._current_row += 1

保存文件（这里的’./dj_data.xls’是默认路径，如果调用此函数，没有传file_url参数，则使用’./dj_data.xls’）

def save_file(self, file_url=‘./dj_data.xls’):

try:

self.write_work.save(file_url)

print(“文件保存成功！文件路径为：” + file_url)

except IOError:

print(“文件保存失败！”)

def get_html(url):

模拟浏览器访问

headers = {

‘User-Agent’: 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ’

'AppleWebKit/537.36 (KHTML, like Gecko) ’

‘Chrome/81.0.4044.138 Safari/537.36’,

‘accept-language’: ‘zh-CN,zh;q=0.9’

}

print(“–> 正在获取网站信息”)

response = requests.get(url, headers=headers) # 请求访问网站

if response.status_code == 200:

html = response.text # 获取网页源码

return html # 返回网页源码

else:

print(“获取网站信息失败！”)

if name == ‘main’:

创建文件

excel = Excel()

搜索关键字

keyword = ‘aj1’

搜索地址

search_url = ‘https://search.jd.com/Search?keyword=’ + keyword + ‘&enc=utf-8’

html = get_html(search_url)

初始化BeautifulSoup库,并设置解析器

soup = BeautifulSoup(html, ‘lxml’)

商品列表

goods_list = soup.find_all(‘li’, class_=‘gl-item’)

打印goods_list到控制台

for li in goods_list: # 遍历父节点

商品编号

no = li[‘data-sku’]

商品名称

name = li.find(class_=‘p-name p-name-type-2’).find(‘em’).get_text()

图片路径

img_url = li.find(class_=‘p-img’).find(‘img’)[‘src’]

价格

price = li.find(class_=‘p-price’).find(‘i’).get_text()

商家

shop = li.find(class_=‘p-shop’).find(‘a’).get_text()
自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数Python工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年Python开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上前端开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以扫码获取！！！（备注：Python）

开发知识点，真正体系化！**

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以扫码获取！！！（备注：Python）

关注

27
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
python爬虫爬取京东商品信息(1)

开发知识点，真正体系化！**
复制链接

扫一扫

专栏目录

班力勤 CSDN认证博客专家 CSDN认证企业博客

码龄1年

193: 原创

1万+: 周排名

9770: 总排名

11万+: 访问

: 等级

4567: 积分

1906: 粉丝

2637: 获赞

5: 评论

2665: 收藏

私信

关注

热门文章

分类专栏

程序员 193篇

最新评论

Koltin48(1)
CSDN-Ada助手: 恭喜您发布了第15篇博客“Kotlin48(1)”！持续创作是一个不断进步的过程，您的坚持和努力是值得称赞的。希望您能继续保持写作的热情和创作的激情，不断挑战自我，探索更多有趣的主题和深度的内容。期待看到您更多精彩的作品！祝您写作愉快！
RxJava 响应式编程 _ 奉上一篇全面的 RxJava2 方法总结
CSDN-Ada助手: 恭喜您发布了第16篇博客，标题看起来很有深度！对于RxJava2的方法总结，相信会给读者带来很大帮助。在您持续创作的道路上，建议您可以尝试深入探讨RxJava2的高级应用场景或者与其他技术的结合，这样能够为读者提供更多有价值的内容。期待您的下一篇作品！
二本Java菜鸟9面字节遭虐，苦修数月深造这份宝典，终进阿里
CSDN-Ada助手: 恭喜您写下如此精彩的第17篇博客！看到您经历了如此艰辛的学习过程，最终能够获得阿里的青睐，实在令人钦佩。希望您能继续坚持创作，分享更多宝贵的经验和心得，或许可以结合您在阿里的工作经验，给大家带来更多的启发和帮助。加油！
你了解 JDK 8 Stream 数据流效率吗？千万级数据量性能如何？
CSDN-Ada助手: 恭喜您撰写了第18篇博客！对于 JDK 8 Stream 数据流效率的探讨，确实是一个很有深度的话题。对千万级数据量的性能测试也很有启发意义。希望您能继续保持创作热情，探索更多有关 Java 编程的主题。或许在未来的博客中，可以分享一些实际项目中应用 Stream 数据流的经验和技巧，这将会让读者受益匪浅。期待您的下一篇作品！
再不看就删了！超详细的Ribbon源码解析
CSDN-Ada助手: 恭喜您发布了第19篇博客！看到您对Ribbon源码的详细解析，让我受益匪浅。希望您能继续保持创作的热情和耐心，不断分享更多有价值的内容。或许在下一篇博客中可以探讨一些与Ribbon相关的实践经验或者案例分析，让读者更好地理解并应用所学知识。期待您的下一篇精彩作品！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。