搜索引擎中下拉框的采集方法

通常采集关键词的办法是直接对要采集的部分审查元素或者查看源代码找到对应部分前后唯一的代码进行前后截取。但是这并不适合下拉框的采集,因为下拉框中的词在该网页的源代码中并不存在。所以我们想要采集下拉框的词就必须找到他们存在的真实网址。
两种方法:
1.利用F12找到网址
2.Fidder

以必应浏览器为例,在搜索框中搜索一个产品词汇,比如:china,点击搜索,出现如下界面,**注意:先不要让他出现下拉框,可以点击空白处,方便找到关键词存在的网址。
必应中搜索china(https://img-blog.csdn.net/20161017095514786)
接着按F12,找到其中的Network(从左往右数第四个)
F12选择NETWORK
这时候需要点击rod mill后边的空白部分,使其出现下拉框,也就是我们需要采集的部分,这时候我们会看到,在下方会出现一个http://global.bing.com/AS/Suggestions开头的一个网址(下拉框出现的时候F12下边新出现的网址就是关键词存在的网址),我们可以双击查看
关键词的真实网址
,这时候我们就可以利用源代码,使用代码截取采集关键词了。
http://global.bing.com/AS/Suggestions?pt=page.serp&bq=china&mkt=en-us&qry=china&cp=5&o=hs&cvid=07BBDFCEB7F54BCDA26F4E1BD4C716FF(我们只需要替换qry后边的china就可以实现批量采集了。)
第二种就是利用软件,原理其实和F12是一样的,找到真实网址,Fidder可以抓取网址,重复第一种的操作,然后可以找到同样的网址(具体我就不说明啦,操作还是很简单的,同时这是一个很棒的软件,安利一波~)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我只会写Bug啊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值