从html页面获取纯文本文件替换其中的内容

    想针对一个非常喜欢的公益网站开发相应的app,但是对方不提供借口,又不想用第三方库,只能自己动手。网页文本内容怎么获取呢?整理了一下网上各位朋友的做法,进行如下处理:

通过NSString里面的 stringwithcontentsOfURL来实现


//通过NSString获取网页的源代码

    NSString * webString=[NSString stringWithContentsOfURL:[NSURL URLWithString:@"http://www.XXOO.com/article/xxxx"] encoding:NSUTF8StringEncoding error:nil];

//找到需要的内容并根据实际情况定义起止位置标签(title为例

    NSString * pageStart01=@"<title>";

    NSString * pageEnd01=@"</title>";

//设置起止点

    NSUInteger startOffset01=[webString rangeOfString:pageStart01].location;

    NSUInteger endOffset01=[webString rangeOfString:pageEnd01].location;

//获取中间的文本(title

    NSString * partialString01=[webString substringWithRange:NSMakeRange(startOffset01, endOffset01-startOffset01)];

//在文本中进行所需要的替换 比如解析出来的页面会多出一个<title>的标签所以将其替换

    NSScanner * scanner=[NSScanner scannerWithString:partialString01];

    while ([scanner isAtEnd]==NO)

    {

        [scanner scanUpToString:@"<" intoString:nil];

        [scanner scanUpToString:@">" intoString:nil];

        partialString01=[partialString01 stringByReplacingOccurrencesOfString:@"<title>" withString:@" "];

    }

注:这个过程实质上就是先获得需要的源文件片段,然后根据需要对其进行删改,进而进行调用或者重构后使用UIWebView进行页面加载,以满足自己需求的界面




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值