plsql 如何拆分函数_Excel实战:如何抓取1688商品数据

接着上次话题,今天继续讲解如何使用网页抓取函数 GetTableByClassNameW(url, css) 抓取1688网站上商品规格型号、价格及库存等数据。

如下图所示,打开一个1688网页,要求抓取规格、价格、库存等数据。

b18532aac8dce647c710a0fea27ffb45.png

根据网页结构,我们很容易知道规格、价格、库存在一张表格中,于是,我们使用Firefox火狐浏览器的检查元素功能,找到表格的样式名或id。

5f2df87edb17b41def5e91ff278062ba.png

从源代码中,找到表格table的class名称是table-sku

42d6269592fc41207298dd519de77596.png

接下来,在excel表中写公式 =GetTableByClassNameW(A2,"table-sku"),打开Excel浏览器启动网页抓取任务。

ca275b7625aca49a3ed3f953252de5bd.png

Excel浏览器完成抓取任务后,回到Excel中,重新计算公式,会得到以下数据。

e2176624f785bdff28d129409592ca5d.png

公式返回的数据是一长串文本,仔细观察,我们发现“-+缺货;”是表格中每一行的最后一个关键词,为了阅读方便,我们按照关键词“-+缺货;”来换行。

1.5米10灯电池款;6.50元;7190套可售;-+缺货;3米20灯电池款;11.00元;9488套可售;-+缺货;3米20灯usb款;11.00元;9941套可售;-+缺货;6米40灯电池款;21.00元;9994套可售;-+缺货;6米40灯usb款;21.00元;9997套可售;-+缺货;......

使用函数Split2Row(data!A1:B18,2,"-+缺货;")将抓取到的表格数据拆分一行一行的。函数中data!A1:B18指表格区域,2指表格第二列是明细行数据,需要拆分,"-+缺货;"是关键词,按此关键词拆分。

b124fc4046e699efdc76011c550fc77c.gif

 拆分后的数据还需要进一步加工,使用公式=Split2Column(B3,";")继续拆分数据,将规格、价格、库存拆分成列。这里按分号";"拆分。

6c0ff4e4c608fc2ea3f66d86ab778c37.gif

经过以上步骤,使用Excel网络函数库的网页抓取函数可以抓取网页数据并进行数据加工处理。看上去有点难,但相比学习Python编程,写个公式要容易得多呢。

如果觉得这个技巧很实用,请帮忙转发给您的朋友

关注我们,获得更多IT小工具↓

fbe0b5567b11e5d72c29b155fcb6432c.png

往期回顾:

在Excel中如何实现人民币大写金额

HR小伙伴周末推荐,如何在Excel中建立生日提醒?

官宣-我是计算机高手!

Excel 批量添加图片的神器来了!

Excel中如何筛选合并单元格

菜鸟裹裹查询接口重新上线啦

如何在Excel中查询币种汇率

如何用Excel抓取网页数据

如何借助Excel浏览器、菜鸟裹裹批量查询快递信息

如何在Excel中使用快递鸟批量查询快递单信息

Excel“减肥”有妙招

如何在Excel中批量查询快递单信息

如何在Excel中查询币种汇率

如何在Excel中批量查看股票价格

Excel 分割字符串

在Excel中如何删除图片背景

Excel快递查询函数大全

ExcelAPI网络函数库目录第一期

WPS用户福利来了

期盼已久的顺丰快递查询上线了

且看"高手"如何用Excel做电子发票台账-上

且看"高手"如何用Excel做电子发票台账-下

如何用一个函数搞定考勤打卡记录

如何用Excel检查两个文本之间相似程度

IP地址归属地批量查询

如何在Excel中绘制地图

如何在Excel中计算CPK和PPK的值

如何突破快递查询限制

Excel实用技巧之高级随机函数

Excel网络函数库接入顺丰新接口

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值