在discuz中,回帖表(forum_post)中的message字段中的内容是以如下形式保存的:
$message = "[i=s] \u672c\u5e16\u6700\u540e\u7531 areyouok \u4e8e 2016-3-5 15:12 \u7f16\u8f91 [\/i]\n\n[attach]41[\/attach][attach]10[\/attach]\u592a\u9633\u5149\uff0c\u91d1\u4eae\u4eae\uff0c\u96c4\u9e21\u9ad8\u9ad8\u5531\r\n";
其中[attach]与[\/attach]中间的部分是附件Id,我需要获取出来然后找到具体附件的内容。
这里就需要使用php正则表达式来获取开始字符串与结束字符串之间的内容,放到一个数组中
一些是测试通过的代码:
<?php //获取开始字符串后的一段字符 $subject = '"./uploads/meinian/96140234039638604.html"\n"./uploads/meinian/json_30_60393801_20140924.txt"'; $pattern = '#"\./uploads/meinian/(.*?)"#i'; $items = preg_match_all($pattern, $subject, $matches); var_dump($matches); echo '
'; //获取开始字符串和结尾字符串之间的部分 $subject = "[i=s] \u672c\u5e16\u6700\u540e\u7531 areyouok \u4e8e 2016-3-5 15:12 \u7f16\u8f91 [\/i]\n\n[attach]41[\/attach][attach]10[\/attach]\u592a\u9633\u5149\uff0c\u91d1\u4eae\u4eae\uff0c\u96c4\u9e21\u9ad8\u9ad8\u5531\r\n"; $pattern = '#\[attach](.*?)\[\\\/attach]#i'; $items = preg_match_all($pattern, $subject, $matches); $target = preg_replace($pattern,'',$subject); echo 'target='.$target.'
'; var_dump($matches); echo '
'; ?>