html转换php教程,PHP将HTML转换成文本一些方法总结

php中html转换成文本提供了自带的函数strip_tags了,但有时此函数不够用,下面总结了一些用户自定的函数,各位可参考.

最常用的使用php函数strip_tags,代码如下:

此处省略几十行HTML代码^_^ SATO;

$str=strip_tags($mystr); //到这里就已经达到我的HTML转为TXT文本的目的了,哈哈,使用这个函数真方便

//下面是插件的一些切词等操作,这里就不多说了 ?>

自定义函数,代码如下:

// 本例将去掉 HTML 标记,javascript 代码 // 和空白字符。还会将一些通用的

// HTML 实体转换成相应的文本。 $search = array ("''si", // 去掉 javascript

"']*?>'si", // 去掉 HTML 标记 "'([rn])[s]+'", // 去掉空白字符

"'&(quot|#34);'i", // 替换 HTML 实体 "'&(amp|#38);'i",

"'&(lt|#60);'i", "'&(gt|#62);'i",

"'&(nbsp|#160);'i", "'&(iexcl|#161);'i",

"'&(cent|#162);'i", "'&(pound|#163);'i",

"'&(copy|#169);'i", "'(d+);'e"); // 作为 PHP 代码运行

$replace = array ("", "",

"\1", """,

"&", "

">", " ",

chr(161), chr(162),

chr(163), chr(169),

"chr(\1)"); $text = preg_replace ($search, $replace, $document);

?>

后来我从网上看到了一个使用PHP写的方法,使用这个方法也可以实现将HTML转为TXT文本,个人觉得也还蛮实用的,在这里分享一下,代码如下:

function HtmlToText($str){ $str=preg_replace("/||{C}/isU","",$str);//去除CSS样式、JS脚本、HTML注释

$alltext="";//用于保存TXT文本的变量 $start=1;//用于检测右标签的控制开关

for($i=0;$i")){//如果检测到>右标签,则使用$start=1;开启截取功能

$start=1; }else if($start==1){//截取功能

if($str[$i]=="

$alltext.="|"; }else if(ord($str[$i])>31){//如果字符是ASCII大于31的有效字符,则将字符添加到$alltext变量中

$alltext.=$str[$i]; }

} }

//下方是去除空格和一些特殊字符的操作 $alltext = str_replace(" "," ",$alltext);

$alltext = preg_replace("/&([^;&]*)(;|&)/","",$alltext); $alltext = preg_replace("/[ ]+/s"," ",$alltext);

return $alltext; }

使用下面这个方法也可以实现将简答的HTML代码转换为TXT文本,实例代码如下:

function html2text($str,$encode = 'GB2312') {

$str = preg_replace("/

$str = preg_replace("/

/i", "n", $str); $str = preg_replace("//i", "nn", $str);

$str = preg_replace("//i", "n", $str); $str = preg_replace("//i", "n", $str);

$str = preg_replace("//i", "n", $str); $str = preg_replace("//i", "n", $str);

$str = preg_replace("/ /i", " ", $str); $str = preg_replace("/ /i", " ", $str);

$str = preg_replace("/&/i", "&", $str); $str = preg_replace("/&/i", "&", $str);

$str = preg_replace("/

$str = preg_replace("/“/i", '"', $str); $str = preg_replace("/&ldquo/i", '"', $str);

$str = preg_replace("/‘/i", "'", $str); $str = preg_replace("/&lsquo/i", "'", $str);

$str = preg_replace("/’/i", "'", $str); $str = preg_replace("/&rsquo/i", "'", $str);

$str = preg_replace("/>/i", ">", $str); $str = preg_replace("/>/i", ">", $str);

$str = preg_replace("/”/i", '"', $str); $str = preg_replace("/&rdquo/i", '"', $str);

$str = strip_tags($str); $str = html_entity_decode($str, ENT_QUOTES, $encode);

$str = preg_replace("/.*?;/i", "", $str);

return $str; }

(责任编辑:最模板)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值