按键精灵 识别html,【院刊】-【201409期】抓取网页指定内容(资料),获取网页里的图片 _ 学院院刊 - 按键精灵论坛...

本文介绍了如何使用按键精灵抓取网页指定的文字,包括处理无特征值的文本元素,以及如何获取并保存网页中的图片。通过HtmlGet命令获取元素信息,结合InStr、Mid等函数过滤和提取文本,实现网页内容的提取。此外,还讲解了如何保存静态与动态图片的方法。
摘要由CSDN通过智能技术生成

抓取网页指定内容(资料),获取网页里的图片最近有遇到同学反馈,网页里的那些没有特征值的文本元素不知道怎么获取。以及,不知道怎么获取保存网页里出现的图片。

bed8d93928e787ead7cf3f7c94bb17b3.gif

获取网页指定文字:

目前按键支持的元素特征值有这些: frame(框架) 、id(唯一标识) 、tag(标签) 、type(类型)、txt(文本) 、value(特征) 、index(索引) 、name(名字) 拥有这些特征值的元素才能直接使用HtmlGet命令来获取元素文本信息。

命令名称:HtmlGet获取网页元素的信息

命令功能:获取网页元素指定属性的信息

命令参数:参数1:字符串型,网页元素属性类型:text、html、outerHtml、value、src、href、offset

参数2:字符串型,网页元素特征字符串

例如下面的例子,按键精灵论坛搜索框,它有type、name、id这三个特征值。

60c2a87930771bc91226ca1864cc03dc.gif

c57cef87c41f645ed39fea6e8ce13697.png

7b724837237fa0536b07afb51933b27c.gif1.jpg(217.62 K)

2016/9/8 11:02:10

我们取它id特征值带入到HtmlGet 命令来查看下结果:

Call Plugin.Web.Bind("WQM.exe")

Call Plugin.Web.go("http://bbs.anjian.com/forum-250-1.html") //要提取信息的网站

Txt=Plugin.Web.HtmlGet("value","id:scbar_txt")

TracePrint Txt复制代码

60c2a87930771bc91226ca1864cc03dc.gif

39941754a6a21580ba99638a08c27230.png

7b724837237fa0536b07afb51933b27c.gif1.jpg(69.66 K)

2016/9/8 11:02:10

成功获取到了搜索框的value值。

我们现在想要取下面红色区域块的帖子标题,想要把一个页面中的这些帖子名称都取出来。

该怎么办?

60c2a87930771bc91226ca1864cc03dc.gif

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值