javascript爬取网页数据

var dd =document.querySelectorAll('#box li')    // 要用All  返回一个数组
// dd 返回下列内容
NodeList(20) [li, li, li, li, li, li, li, li, li, li, li, li, li, li, li, li, li, li, li, li]
// 遍历tittl
for(var dom of dd){
    console.log(dom.querySelector('span').innerText)
}
// 返回结果
多亮 - 剑震江湖
sentry5.6.1.min.js:2 江映蓉 - 依然
sentry5.6.1.min.js:2 Sunnee杨芸晴 - 乘风破浪
sentry5.6.1.min.js:2 周深 - 归处
sentry5.6.1.min.js:2 Billie Eilish、ROSALÍA - Lo Vas A Olvidar
sentry5.6.1.min.js:2 By2 - 大红包
sentry5.6.1.min.js:2 萨顶顶 - 海底
sentry5.6.1.min.js:2 Ty.、AnsrJ、Dj Chronic - 新西部爱情
sentry5.6.1.min.js:2 刘若英 - 黄金年代
sentry5.6.1.min.js:2 张杰 - 像一道光
sentry5.6.1.min.js:2 吴琼 - 醉清欢
sentry5.6.1.min.js:2 毛阿敏 - 迷雾之光
sentry5.6.1.min.js:2 胡夏 - 无人知晓的梦
sentry5.6.1.min.js:2 赵慧仙(선재) - I’m Missing You
sentry5.6.1.min.js:2 邓典果DDG、Sway X - Shake
sentry5.6.1.min.js:2 请夏 - X
sentry5.6.1.min.js:2 满舒克 - LOOK FOR ME
sentry5.6.1.min.js:2 AKA宝藏潮牛、侯志斌、宋文洋、飞鸟 - 恭喜恭喜
sentry5.6.1.min.js:2 告五人 - 唯一
sentry5.6.1.min.js:2 白安 - 白色
// 遍历图片地址
for(var dom of dd){
// console.log(dom.querySelector('span').innerText)  tittl的遍历
    console.log(dom.querySelector('img').src)
}
// 返回结果
https://p3fx.kgimg.com/mvpic/e4/52/e452cec897f538c33175898ad2defee9.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/f8/32/f832fa2620302e56c3b5b1eaf7c36465.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/27/9b/279bb84ef43c4fdd4efa5130da9b87c8.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/c8/e1/c8e1a89390563d657bd1517c4a28045c.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/9b/94/9b94490b6b552caeedd7d223dc1f5eb3.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/77/38/77385df8c26694b00b05a0a8de4f1658.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/36/df/36dfa43b933977a156c339952a19d18a.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/f7/f6/f7f6f90378a37c99e1ae4276c0aa1ae6.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/04/b8/04b8842e992ac3e0238d6288ea9c02c1.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/f0/a1/f0a1d2bc4cf81e7a5d43b1db1c031d65.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/e6/98/e698f5c8bd302ad40df62db0f7bada40.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/32/30/32307504ac798648bfeab2fec4f4a7d7.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/9f/88/9f88ed98b70c5672278d354dcf2369ff.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/f3/65/f3656fed44abafb029756069e1382710.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/22/b1/22b163165d8d56fc32b4f5e7ef9f83c6.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/74/50/7450435eb9422e5e310ab6458cfa2027.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/b6/68/b668bbd3e0297c3ceab669e947b2ad53.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/f1/3b/f13b3be997df7d886a98a31a67bfb7ba.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/db/d4/dbd47c443f6d34a062488e19cbc6b68b.jpg
sentry5.6.1.min.js:2 https://p3fx.kgimg.com/mvpic/80/5d/805d8eafe872fa45a6235b853f41171a.jpg
// 创建一个新的空数组
var data = []
// 遍历并赋值 同时添加到新数组内
for(var dom of dd){
    var tex = (dom.querySelector('span').innerText)
    var imga = (dom.querySelector('img').src)
data.push({tex,imga})
}
// 返回结果
(20) [{}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}]
0: {tex: "多亮 - 剑震江湖", imga: "https://p3fx.kgimg.com/mvpic/e4/52/e452cec897f538c33175898ad2defee9.jpg"}
1: {tex: "江映蓉 - 依然", imga: "https://p3fx.kgimg.com/mvpic/f8/32/f832fa2620302e56c3b5b1eaf7c36465.jpg"}
2: {tex: "Sunnee杨芸晴 - 乘风破浪", imga: "https://p3fx.kgimg.com/mvpic/27/9b/279bb84ef43c4fdd4efa5130da9b87c8.jpg"}
3: {tex: "周深 - 归处", imga: "https://p3fx.kgimg.com/mvpic/c8/e1/c8e1a89390563d657bd1517c4a28045c.jpg"}
4: {tex: "Billie Eilish、ROSALÍA - Lo Vas A Olvidar", imga: "https://p3fx.kgimg.com/mvpic/9b/94/9b94490b6b552caeedd7d223dc1f5eb3.jpg"}
5: {tex: "By2 - 大红包", imga: "https://p3fx.kgimg.com/mvpic/77/38/77385df8c26694b00b05a0a8de4f1658.jpg"}
6: {tex: "萨顶顶 - 海底", imga: "https://p3fx.kgimg.com/mvpic/36/df/36dfa43b933977a156c339952a19d18a.jpg"}
7: {tex: "Ty.、AnsrJ、Dj Chronic - 新西部爱情", imga: "https://p3fx.kgimg.com/mvpic/f7/f6/f7f6f90378a37c99e1ae4276c0aa1ae6.jpg"}
8: {tex: "刘若英 - 黄金年代", imga: "https://p3fx.kgimg.com/mvpic/04/b8/04b8842e992ac3e0238d6288ea9c02c1.jpg"}
9: {tex: "张杰 - 像一道光", imga: "https://p3fx.kgimg.com/mvpic/f0/a1/f0a1d2bc4cf81e7a5d43b1db1c031d65.jpg"}
10: {tex: "吴琼 - 醉清欢", imga: "https://p3fx.kgimg.com/mvpic/e6/98/e698f5c8bd302ad40df62db0f7bada40.jpg"}
11: {tex: "毛阿敏 - 迷雾之光", imga: "https://p3fx.kgimg.com/mvpic/32/30/32307504ac798648bfeab2fec4f4a7d7.jpg"}
12: {tex: "胡夏 - 无人知晓的梦", imga: "https://p3fx.kgimg.com/mvpic/9f/88/9f88ed98b70c5672278d354dcf2369ff.jpg"}
13: {tex: "赵慧仙(선재) - I’m Missing You", imga: "https://p3fx.kgimg.com/mvpic/f3/65/f3656fed44abafb029756069e1382710.jpg"}
14: {tex: "邓典果DDG、Sway X - Shake", imga: "https://p3fx.kgimg.com/mvpic/22/b1/22b163165d8d56fc32b4f5e7ef9f83c6.jpg"}
15: {tex: "请夏 - X", imga: "https://p3fx.kgimg.com/mvpic/74/50/7450435eb9422e5e310ab6458cfa2027.jpg"}
16: {tex: "满舒克 - LOOK FOR ME", imga: "https://p3fx.kgimg.com/mvpic/b6/68/b668bbd3e0297c3ceab669e947b2ad53.jpg"}
17: {tex: "AKA宝藏潮牛、侯志斌、宋文洋、飞鸟 - 恭喜恭喜", imga: "https://p3fx.kgimg.com/mvpic/f1/3b/f13b3be997df7d886a98a31a67bfb7ba.jpg"}
18: {tex: "告五人 - 唯一", imga: "https://p3fx.kgimg.com/mvpic/db/d4/dbd47c443f6d34a062488e19cbc6b68b.jpg"}
19: {tex: "白安 - 白色", imga: "https://p3fx.kgimg.com/mvpic/80/5d/805d8eafe872fa45a6235b853f41171a.jpg"}
// 将data数组转为json字符串
JSON.stringify(data)
// 返回结果
// "[{"tex":"多亮 - 剑震江湖","imga":"https://p3fx.kgimg.com/mvpic/e4/52/e452cec897f538c33175898ad2defee9.jpg"},{"tex":"江映蓉 - 依然","imga":"https://p3fx.kgimg.com/mvpic/f8/32/f832fa2620302e56c3b5b1eaf7c36465.jpg"},{"tex":"Sunnee杨芸晴 - 乘风破浪","imga":"https://p3fx.kgimg.com/mvpic/27/9b/279bb84ef43c4fdd4efa5130da9b87c8.jpg"},{"tex":"周深 - 归处","imga":"https://p3fx.kgimg.com/mvpic/c8/e1/c8e1a89390563d657bd1517c4a28045c.jpg"},{"tex":"Billie Eilish、ROSALÍA - Lo Vas A Olvidar","imga":"https://p3fx.kgimg.com/mvpic/9b/94/9b94490b6b552caeedd7d223dc1f5eb3.jpg"},{"tex":"By2 - 大红包","imga":"https://p3fx.kgimg.com/mvpic/77/38/77385df8c26694b00b05a0a8de4f1658.jpg"},{"tex":"萨顶顶 - 海底","imga":"https://p3fx.kgimg.com/mvpic/36/df/36dfa43b933977a156c339952a19d18a.jpg"},{"tex":"Ty.、AnsrJ、Dj Chronic - 新西部爱情","imga":"https://p3fx.kgimg.com/mvpic/f7/f6/f7f6f90378a37c99e1ae4276c0aa1ae6.jpg"},{"tex":"刘若英 - 黄金年代","imga":"https://p3fx.kgimg.com/mvpic/04/b8/04b8842e992ac3e0238d6288ea9c02c1.jpg"},{"tex":"张杰 - 像一道光","imga":"https://p3fx.kgimg.com/mvpic/f0/a1/f0a1d2bc4cf81e7a5d43b1db1c031d65.jpg"},{"tex":"吴琼 - 醉清欢","imga":"https://p3fx.kgimg.com/mvpic/e6/98/e698f5c8bd302ad40df62db0f7bada40.jpg"},{"tex":"毛阿敏 - 迷雾之光","imga":"https://p3fx.kgimg.com/mvpic/32/30/32307504ac798648bfeab2fec4f4a7d7.jpg"},{"tex":"胡夏 - 无人知晓的梦","imga":"https://p3fx.kgimg.com/mvpic/9f/88/9f88ed98b70c5672278d354dcf2369ff.jpg"},{"tex":"赵慧仙(선재) - I’m Missing You","imga":"https://p3fx.kgimg.com/mvpic/f3/65/f3656fed44abafb029756069e1382710.jpg"},{"tex":"邓典果DDG、Sway X - Shake","imga":"https://p3fx.kgimg.com/mvpic/22/b1/22b163165d8d56fc32b4f5e7ef9f83c6.jpg"},{"tex":"请夏 - X","imga":"https://p3fx.kgimg.com/mvpic/74/50/7450435eb9422e5e310ab6458cfa2027.jpg"},{"tex":"满舒克 - LOOK FOR ME","imga":"https://p3fx.kgimg.com/mvpic/b6/68/b668bbd3e0297c3ceab669e947b2ad53.jpg"},{"tex":"AKA宝藏潮牛、侯志斌、宋文洋、飞鸟 - 恭喜恭喜","imga":"https://p3fx.kgimg.com/mvpic/f1/3b/f13b3be997df7d886a98a31a67bfb7ba.jpg"},{"tex":"告五人 - 唯一","imga":"https://p3fx.kgimg.com/mvpic/db/d4/dbd47c443f6d34a062488e19cbc6b68b.jpg"},{"tex":"白安 - 白色","imga":"https://p3fx.kgimg.com/mvpic/80/5d/805d8eafe872fa45a6235b853f41171a.jpg"}]"
// JSON字符串复制,去掉引号就可以使用
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
当涉及到爬取网页数据时,有几种常见的方法和工具可以使用。以下是一个简单的教程,介绍了一种常见的爬取网页数据的方法: 1. 选择合适的编程语言:爬取网页数据通常需要使用编程语言来编写代码。常见的选择包括Python、Java和JavaScript等。其中,Python是最受欢迎的语言之一,因为它有许多强大的库和框架可以用于爬虫开发。 2. 安装必要的库和工具:对于Python来说,你可以使用一些流行的库来进行网页数据爬取,例如Requests、BeautifulSoup和Scrapy等。你可以使用pip命令来安装这些库。 3. 发送HTTP请求:使用HTTP请求库(如Requests)发送HTTP请求到目标网页。你可以发送GET请求获取网页内容,或者发送POST请求提交表单数据。 4. 解析网页内容:使用HTML解析库(如BeautifulSoup)解析网页内容。这样你就可以提取出你感兴趣的数据,例如标题、链接、文本等。 5. 存储数据:将提取到的数据存储到合适的地方,例如数据库、CSV文件或者Excel表格中。 6. 处理反爬机制:有些网站可能会采取反爬机制,例如限制访问频率、验证码等。你可能需要使用代理IP、用户代理、验证码识别等技术来绕过这些限制。 7. 遵守法律和道德规范:在进行网页数据爬取时,务必遵守相关的法律和道德规范。尊重网站的隐私政策和使用条款,并确保你的爬虫行为不会对网站造成过大的负担。 希望以上教程对你有所帮助!如果你有任何进一步的问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

尤山海

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值