＜爬虫＞利用selenium 按照输入的商品名爬取商品的信息

最新推荐文章于 2022-04-19 23:29:41 发布

当代女大学生

最新推荐文章于 2022-04-19 23:29:41 发布

阅读量476

点赞数

分类专栏： Python 文章标签： python 爬虫

本文链接：https://blog.csdn.net/qq_36895331/article/details/121480510

版权

本文介绍如何利用selenium爬虫工具，通过输入商品名称在淘宝上搜索并获取页面源代码，再借助BeautifulSoup解析，最终得到所需商品信息的详细步骤。

摘要由CSDN通过智能技术生成

参数获取

打开网址淘宝搜索
右键选择“检查”
点击左上角的图标
点击页面上的内容即可查看代码所在位置
扫码登录淘宝
重复step3、step4得到商品的信息

代码解析

传入搜索内容进行搜索

from selenium import webdriver
from bs4 import BeautifulSoup as bs
import pandas as pd

# 获取url信息
browser = webdriver.Chrome()
browser.get('https://s.taobao.com')

# input_1是输入框 button是搜索按钮
input_1=browser.find_element_by_class_name('search-combobox-input')
button=browser.find_element_by_class_name('btn-search')

# 传入要搜索内容 iPad 点击搜索按钮
input_1.send_keys('iPad')
button.click()

获取页面源代码

html = browser.page_source  # 获得网页源代码
soup = bs(html)             # html字符串创建B

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

当代女大学生

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python爬虫，根据搜索关键字爬取京东商品信息

SunBB2016的博客

08-03

1920

因为有在双十一配主机的计划，所有就产生了采集京东上指定商品信息（主要是价格）的想法。花闲余时间简单学习了下Python，参考了一些其他人的爬虫代码，最终完成一个比较简单的Python爬虫。可以根据商品ID或者搜索关键字爬取商品信息。主要代码 import requests from lxml.html import etree import csv import time import datetime def getHeader(referer): headers = { 'a

自学爬虫项目(二)一一利用selenium模拟淘宝登录，爬取商品数据

壹乐的博客

02-02

2397

文章目录前言一、明确目标二、分析过程前言你是否还在为学习Python没有方向而苦恼？快来跟着壹乐一起学习吧！让我们共同进步！今天我们用selenium与BeautifulSoup联动来模拟用户登录淘宝，爬取商品数据，让我们一起来尝尝这碗靓汤吧！???????????? 警告：本教程仅用作学习交流，请勿用作商业盈利，违者后果自负！如本文有侵犯任何组织集团公司的隐私或利益，请告知联系壹乐删除！！！一、明确目标根据我们输入的关键字搜索商品，从而查找爬取商品的名称，店铺名，价格，成交量，地址及商品链接

参与评论您还未登录，请先登录后发表或查看评论

二种方法从Magento获取商品ID和商品信息

ecshop数据采集发布接口，zencart，lightinthebox，shopex 采集，快客

06-02

1111

们在Magento的Catalog Model设计Magento模板时，可以通过下面二个方法来获取商品信息：方法一：通过ID里获取商品详情 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 <?php $model = Mage::getModel('catalog/product')

python 淘宝搜索_自学python之爬虫2获取淘宝网搜索页面的商品名称和价格

weixin_39628271的博客

12-10

661

目标：获取淘宝搜索页面的信息，提取其中的商品名称和价格程序的设计结构：步骤1：提交商品获取请求，循环获取页面步骤2：对于每个页面，提取商品名称和价格信息步骤3：将信息输到屏幕上在淘宝网站的搜索框中输入关键词如“书包”，点击搜索，查看结果首页的url为：https://s.taobao.com/search?q=%E4%B9%A6%E5%8C%85&imgfile=&commend...

Python爬虫之淘宝数据爬取（商品名称，价格，图片，销量）

牵一只蜗牛去散步

05-11

9944

代码详细注释，仅供交流与参考，不作商业用途代码参考北京理工大学嵩天老师 import requests #导入第三方库 import re import os def getHTMLText(url): try: r = requests.get(url, timeout = 30) #timeout超时响应参数，这里是30秒 r.raise_for_status() #判断是否异常，200为正常 r.encoding = r.appare

【Python】爬虫获取购物网站的商品信息、商品图片

qq_52201194的博客

04-19

4793

【Python】爬虫、爬取购物网站数据、Selenium安装教程及环境搭建前言一、Selenium安装二、Chrome安装驱动：三、某东爬虫代码：四、成果展示：五、结束语：【Python】爬虫、爬取购物网站数据、Selenium安装教程及环境搭建 ) 前言 Selenium是一个用电脑模拟人操作浏览器网页，可以实现自动化，测试等！本文主要使用Selenium库与chrome浏览器进行数据获取。一、Selenium安装 pip install selenium 二、Chrome安装驱动： chrome

1688爬虫，通过搜索关键词采用selenium爬取指定页数的商品信息.zip

03-01

爬虫（Web Crawler）是一种自动化程序，用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储，以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的...

Python爬虫+selenium——爬取淘宝商品信息和数据分析

qq_60479747的博客

12-15

4166

Python+selenium爬取淘宝商品，1.驱动浏览器访问淘宝网页，2.进行搜索，扫码登录，3.页面滚动，获取数据

Java爬虫，使用WebMagis+selenium爬取某东商品信息.zip

03-29

【Java爬虫与WebMagic+Selenium爬取京东商品信息】 Java爬虫技术是软件开发中的一个重要组成部分，尤其在数据挖掘、市场分析等领域有着广泛应用。WebMagic是一个强大的Java爬虫框架，它提供了简单易用的API，使得...

用python模拟登录淘宝并获取所有订单

python学习者的博客

04-02

7313

经过多次尝试，模拟登录淘宝终于成功了，实在是不容易，淘宝的登录加密和验证太复杂了，煞费苦心，在此写出来和大家一起分享，希望大家支持。温馨提示现在淘宝换成了滑块验证了，比较难解决这个问题，以下的代码没法用了，仅作学习参考研究之用吧。本篇内容 1. python模拟登录淘宝网页 2. 获取登录用户的所有订单详情 3. 学会应对出现验证码的情况 4. 体会一下复杂的模拟登录机制探...

[Python] python + selenium 抓取京东商品数据（商品名称，售价，店铺，分类，订单信息，好评率，评论等）

热门推荐

su_2018的博客

03-29

1万+

目录一、环境二、简介三、京东网页分析 1.获取商品信息入口--商品列表链接获取 2.获取商品信息入口--商品详情链接获取 3.商品详情获取 4.商品评论获取四、代码实现五、运行结果六、结语一、环境 win10 + python 3.7 + pycharm64 + selenium 二、简介抓取京东商品页面信息：商品名称，...

Combobox实现自动匹配输入

yangzhichao_csdn的博客

12-27

2649

代码案例实现效果：combobox输入内容后，按键盘下方向键或鼠标双击，能匹配输入框中匹配到的内容要点：combobox的state设置为"readonly"时，点击combobox输入框处会自动弹出下拉列表，但设置为"readonly"时，combobox无法输入，所以这里我绑定了鼠标左键单击事件，左键单击恢复combobox的state属性为"normal"，这样有可以恢复输入了。匹配触发动作可以根据自己的需求改，代码案例写的是按方向键小或鼠标左键双击，触发匹配动作。 import tk

python爬虫手动输入淘宝名称获取淘宝信息

qq_52491868的博客

08-02

2482

使用主要爬取手段urllib.request模块 python爬虫小白，欢迎来点赞成果图运行结果制作过程 #淘宝 import urllib.request import urllib.parse import time,random,csv class TaoBao(): #获取请求头和网页链接作为以下使用 def __init__(self): self.url='https://s.taobao.com/search?q={}&bc...

【爬虫】selenium+webdrive抓取淘宝商品评价

weixin_44908251的博客

04-26

842

【爬虫】selenium+webdrive抓取淘宝商品评价爬虫小白入门（声明：本人只是处于突如其来的兴趣学习一点点，水平实在不高，但在这个过程中也或多或少地解决了一些问题，所以对同为小白的朋友们或许有用，但还请大神们不要笑我！）动手前必备的知识包括：网页"html"的语法应当基本了解一些，比如"<div、tr、tb>"表示的是什么；python的基本语法一、环境配置 selenium安装：本人很懒哈哈哈，所以不管安装啥都是用anaconda prompt的黑框框pip的这里是

爬虫爬取淘宝商品信息

qq_43764365的博客

05-31

3250

爬虫爬取淘宝商品信息前面已经写过一篇获取淘宝信息的文章，但是那篇文章并没有获取商品详情页下面的信息，也没有数据保存功能，这篇文章就是在上篇文章上增加了商品详情页信息的获取和数据保存为xls文件，原理和上一篇文章一样，故不做过多介绍，想看看原理的请看上一篇博客，博客传送门爬虫爬取京东和淘宝商品信息。不明白的老规矩，评论区留言讨论或者加QQ2511217211（加Q请备注讨论，否则不予通过）。代码如下： # coding=UTF-8 from selenium import webdriver from t

Python爬虫之获取淘宝商品信息

05-26

4232

首先需要先导入webdriver from selenium import webdriver 复制代码 webdriver支持主流的浏览器，比如说：谷歌浏览器、火狐浏览器、IE浏览器等等然后可以创建一个webdriver对象，通过这个对象就可以通过get方法请求网站 driver = webdriver.Chrome() # 创建driver对象 driver.get('https://www.baidu.com') # 请求百度复制代码接下来可以定义一个方法：search_produ

【案例实现】使用 Python 获取页面商品数据（修正版）

Mr.River的博客

02-05

6804

基于原文章21年编写的爬虫的内容进行补充与排版修改版本。方便于近期大学生访问有效阅读性的修改。

用sklearn进行PCA（主成分分析）

今天你学习了吗？

05-24

1万+

PCA主要是用来数据降维，将高纬度的特征映射到低维度的特征，加快机器学习的速度。原理：在这个图片中，我们用两个特征来描述样本，分别是attack，defense。但如右图所示，作两条线，可以看出在右边这条线上有较大的方差，而左边这条线的方差比较小。方差越大，所包含的信息就越多。那么如何把这两个特征进行降维呢，降维要尽可能保持原始数据的信息，故要取使方差最大的一个维度（本例中从二维降到一维）。假设右边这条线的方差最大，我们就可以把这条线所在的直线当作降维后的一个维度。也就是二维降到一维后，这.

python for循环实现从大到小

今天你学习了吗？

01-23

8471

大的数字要写在小的数字前面，并且在后面加上-1 for i in range(大的数字,小的数字,-1) 例如： for i in range(5,1,-1): print(i) 输出的是：5 4 3 2

实践一个爬取京东商品信息的Python网络爬虫代码