iOS 轻量级 HTML 解析方案

一个轻量级的 Objective-C-HMTL-Parser 解析库,这里主要是希望 HTML 解析出想要的标签字段。

题外:如果是要将 HTML 解析成富文本展示,推荐 DTCoreText

添加到 framework 或 app 在 Build Setting 的 Header Search Paths 添加 $(SDKROOT)/usr/include/libxml2。

如果是添加到 podspec 则添加,则:

s.library = 'xml2'
s.xcconfig = { 'HEADER_SEARCH_PATHS' => '$(SDKROOT)/usr/include/libxml2', 'OTHER_LDFLAGS' => '-lxml2' }
复制代码

解决 libxml2 中文乱码

/**
 解决 xml2 中文乱码
 参考:https://blog.fedepot.com/ios-9-htmlparserzhong-wen-luan-ma-wen-ti/
 */
-(id)initWithString:(NSString*)string error:(NSError**)error
{
    if (self = [super init])
    {
        _doc = NULL;
        
        if ([string length] > 0)
        {
            CFStringEncoding cfenc = CFStringConvertNSStringEncodingToEncoding(NSUTF8StringEncoding);
            CFStringRef cfencstr = CFStringConvertEncodingToIANACharSetName(cfenc);
            const char *enc = CFStringGetCStringPtr(cfencstr, 0);
            //Fix iOS9 Chinese wrong characters - begin
            char buffer[255];
            if (enc == NULL) {
                if (CFStringGetCString(cfencstr, buffer, 255, kCFStringEncodingUTF8)) enc = buffer;
            }
            //Fix iOS9 Chinese wrong characters - end
            // _doc = htmlParseDoc((xmlChar*)[string UTF8String], enc);
            int optionsHtml = HTML_PARSE_RECOVER;
            optionsHtml = optionsHtml | HTML_PARSE_NOERROR; //Uncomment this to see HTML errors
            optionsHtml = optionsHtml | HTML_PARSE_NOWARNING;
            _doc = htmlReadDoc ((xmlChar*)[string UTF8String], NULL, enc, optionsHtml);
        }
        else
        {
            if (error) {
                *error = [NSError errorWithDomain:@"HTMLParserdomain" code:1 userInfo:nil];
            }
        }
    }
    
    return self;
}
复制代码

转载于:https://juejin.im/post/5c46fd3d6fb9a049a62cea0d

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值