Objective-C中一个HTMLParser的使用笔记

近来需要分析网页HTML元素,在stackoverflow中找到这个开源工具类,特来分享之:

从创建工程开始,新建工程HTMLParserDemo,这里我选择 Command Line Tool

1,将类文件夹拖入项目,直接拖拽近来即可,选项全部用默认


图一


2,包含所有.h文件(#import)

在main.m中引入所有文件,目测只需要 #import "HTMLParser.h",

这时候编译的话 会提示找不到<libxml/HTMLparser.h>

3,在项目设置里面搜索 “header search paths”,添加 "/usr/include/libxml2" 


完成后编译应该会12个链接错误,因为找不到符号。

4,添加Framework “libxml2.dylib”==》


手动输入libxml,就能定位到目标,点击add进来即可

现在编译应该可以成功通过。接下来写个demo看看:

static void demo(),里面写上代码:


NSError *error = nil;
NSString *html =
    @"<ul>"
        "<li><input type='image' name='input1' value='string1value' /></li>"
        "<li><input type='image' name='input2' value='string2value' /></li>"
    "</ul>"
    "<span class='spantext'><b>Hello World 1</b></span>"
    "<span class='spantext'><b>Hello World 2</b></span>";
HTMLParser *parser = [[HTMLParser alloc] initWithString:html error:&error];

if (error) {
    NSLog(@"Error: %@", error);
    return;
}

HTMLNode *bodyNode = [parser body];

NSArray *inputNodes = [bodyNode findChildTags:@"input"];

for (HTMLNode *inputNode in inputNodes) {
    if ([[inputNode getAttributeNamed:@"name"] isEqualToString:@"input2"]) {
        NSLog(@"%@", [inputNode getAttributeNamed:@"value"]); //Answer to first question
    }
}

NSArray *spanNodes = [bodyNode findChildTags:@"span"];

for (HTMLNode *spanNode in spanNodes) {
    if ([[spanNode getAttributeNamed:@"class"] isEqualToString:@"spantext"]) {
        NSLog(@"%@", [spanNode rawContents]); //Answer to second question
    }
}

[parser release];

在main里面调用,编译运行,可以看到结果:



文章示例代码下载:
http://download.csdn.net/detail/ccnyou/4535746


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值