http https 网址链接的写法

如果站点中既有http的资源 又有https的资源 解决办法

    <img src='//psp.ess.cn/InspMeter/images/a.jpg' />
    <a href="//psp.ess.cn/InspMeter/InspmeterInfo/InspmeterInfo.jsp" target="_blank">

这行代码如果放在HTTP的网页上,那么请求的资源就是http://psp.ess.cn/InspMeter/images/a.jpg,如果放在HTTPS上,则访问的资源就是HTTPS的。这样一来就无需为HTTP和HTTPS各自准备不同的网页了。

在WebMagic中,可以使用XPath或CSS选择器来定位链接元素。 1. 使用XPath定位链接: - 通过标签名定位:`//a`,例如:`//a` - 通过文本内容定位:`//a[text()='link text']`,例如:`//a[text()='Click here']` - 通过属性定位:`//a[@attribute='value']`,例如:`//a[@href='http://example.com']` 2. 使用CSS选择器定位链接: - 通过标签名定位:`a`,例如:`a` - 通过属性定位:`a[attribute='value']`,例如:`a[href='http://example.com']` 在WebMagic中,可以使用`Html.xpath()`方法和`Html.css()`方法来进行链接元素定位。下面是一个示例: ```java import us.codecraft.webmagic.Page; import us.codecraft.webmagic.Site; import us.codecraft.webmagic.Spider; import us.codecraft.webmagic.processor.PageProcessor; public class MyPageProcessor implements PageProcessor { private Site site = Site.me(); @Override public void process(Page page) { // 使用XPath定位链接 String link = page.getHtml().xpath("//a[text()='Click here']/@href").get(); System.out.println("Link: " + link); // 使用CSS选择器定位链接 String link2 = page.getHtml().css("a[href='http://example.com']").get(); System.out.println("Link2: " + link2); } @Override public Site getSite() { return site; } public static void main(String[] args) { Spider.create(new MyPageProcessor()) .addUrl("http://example.com") .run(); } } ``` 上述代码中,`process()`方法中使用了XPath和CSS选择器来定位链接元素,并通过`get()`方法获取链接的内容。你可以根据具体的网页结构和需求来选择合适的定位方式。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值