Perl HTML::TreeBuilder模块讲解

本文详细介绍了Perl中的HTML::TreeBuilder模块,它用于解析HTML文件并构建HTML结构解析树。通过实例展示了如何创建、查找、修改和输出HTML元素,包括as_text、find、attr、look_up、look_down等方法的使用,以及XML输出和属性处理等功能。
摘要由CSDN通过智能技术生成

HTML::TreeBuilder继承自HTML::Parser和HTML::Element,所以下面讲的很多方法实际上源于HTML::Parser和HTML::Element。

拿下面这个HTML文件开刀:

<html lang='i-klingon'>
     <head><title>Pati Pata</title></head>
     <body>
       <h1 lang='la'>职工</h1>
       <p lang='es-MX' align='center'>
         Foo bar baz <cite>Quux</cite>.
       </p>
       <p>Hooboy.</p>
     </body>
  </html>

perl代码:

#!/usr/bin/perl
use HTML::Element;
use HTML::TreeBuilder;

foreach my $file_name (@ARGV) {
    my $tree = HTML::TreeBuilder->new;
    $tree->parse_file($file_name);
	$head=$tree->find_by_tag_name('head');      ##找到head节点
	print $head->attr('_parent')->as_text();        ##_parent属性的值是html节点
	print "\n";
    $tree = $tree->delete;
}

 首先根据一个文件创建了一棵HTML结构解析树$tree,注意$tree本身也是HTML::Element的一个实例,因为HTML::TreeBuilder继承自 HTML::Element。

调用<html>节点的as_text输出:Pati Pata职工 Foo bar baz Quux. Hooboy.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值