imagetotxt php_PHP将HTML转为TXT文本

需要将HTML转换为TXT文本的内容。

于是翻了翻W3C的PHP手册,因为对PHP的函数库不太熟悉,只找到htmlspecialchar(不对转义字符进行转换)函数和nl2br(将字符串转换成HTML的标签)函数。这显然不是我现在想要的,于是我在自己平时积累下来的PHP函数库中,使用中文进行了一翻搜索,终于发现了一个函数——strip_tags(功能:从字符串中去除HTML和PHP标记)

$mystr=<<

此处省略几十行HTML代码^_^

SATO;

$str=strip_tags($mystr);

//到这里就已经达到我的HTML转为TXT文本的目的了,哈哈,使用这个函数真方便

//下面是插件的一些切词等操作,这里就不多说了

?>

后来我从网上看到了一个使用PHP写的方法,使用这个方法也可以实现将HTML转为TXT文本,个人觉得也还蛮实用的,在这里分享一下,代码如下:

function HtmlToText($str){

$str=preg_replace("/||/isU","",$str);//去除CSS样式、JS脚本、HTML注释

$alltext="";//用于保存TXT文本的变量

$start=1;//用于检测右标签的控制开关

for($i=0;$i

if(($start==0)&&($str[$i]==">")){//如果检测到>右标签,则使用$start=1;开启截取功能

$start=1;

}else if($start==1){//截取功能

if($str[$i]=="|替换

$start=0;

$alltext.="|";

}else if(ord($str[$i])>31){//如果字符是ASCII大于31的有效字符,则将字符添加到$alltext变量中

$alltext.=$str[$i];

}

}

}

//下方是去除空格和一些特殊字符的操作

$alltext = str_replace(" "," ",$alltext);

$alltext = preg_replace("/&([^;&]*)(;|&)/","",$alltext);

$alltext = preg_replace("/[ ]+/s"," ",$alltext);

return $alltext;

}

使用上面这个方法也可以实现将简答的HTML代码转换为TXT文本。

最后说一下htmlspecialchars、nl2br这两个与HTML相关的PHP函数:

htmlspecialchars(不对转义字符进行转换):

实例:echo htmlspecialchars("baidu");//<a href="#">baidu</a>

nl2br(将字符串转换成HTML的标签):

实例:echo nl2br("PHP");//PHP

以上就是关于HTML转换为TXT文本的一些方法,不妥之处恳请指正^_^

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值