php交互百度百科,百度百科的基本词链接是怎样实现的呢

百度百科的关键词链接是怎样实现的呢

百度百科的关键词带有链接。我在想少量关键词,只需要简单替换成链接就可以。可是百度的关键词是狠多的,可能成万上千万个。如果替换上万次,那效率也太低了吧。请教这样的功能是怎样实现的呢?谢谢!

附截图:

132541325.jpg

关键字链接

------解决方案--------------------

好吧,我再发一遍include 'TTrie.php';

class wordkey extends TTrie {

function b() {

$t = array_pop($this->buffer);

$this->buffer[] = "$t";

}

}

$p = new wordkey;

$p->set('秦始皇', 'b');

$p->set('洛阳', 'b');

$t = $p->match('秦始皇东巡洛阳');

echo join('', $t);秦始皇东巡洛阳

TTrie.phpclass TTrie {

protected $buffer = array();

protected $dict = array( array() );

protected $input = 0; //字符串当前偏移

protected $backtracking = 0; //字符串回溯位置

public $debug = 0;

public $savematch = 1;

function set($word, $action='') {

if(is_array($word)) {

foreach($word as $k=>$v) $this->set($k, $v);

return;

}

$p = count($this->dict);

$cur = 0; //当前节点号

foreach(str_split($word) as $c) {

if (isset($this->dict[$cur][$c])) { //已存在就下移

$cur = $this->dict[$cur][$c];

continue;

}

$this->dict[$p]= array(); //创建新节点

$this->dict[$cur][$c] = $p; //在父节点记录子节点号

$cur = $p; //把当前节点设为新插入的

$p++;

}

$this->dict[$cur]['acc'] = $action; //一个词结束,标记叶子节点

}

function getto($ch) {

$i =& $this->input; //字符串当前偏移

$p =& $this->backtracking; //字符串回溯位置

$len = strlen($this->doc);

$t = '';

$this->input++;

//while($this->inputdoc{$this->input} != $ch) $t .= $this->doc{$this->input++};

//$t .= $this->doc{$this->input++};

do {

if($this->input >= $len) break;

$t .= $this->doc{$this->input};

}while($this->doc{$this->input++} != $ch);

return trim($t);

}

function match($s) {

$this->doc =& $s;

$this->buffer = array();

$ret = array();

$cur = 0; //当前节点,初始为根节点

$i =& $this->input; //字符串当前偏移

$p =& $this->backtracking; //字符串回溯位置

$i = $p = 0;

$s .= "\0"; //附加结束符

$len = strlen($s);

$buf = '';

while($i 

$c = $s{$i};

if(isset($this->dict[$cur][$c])) { //如果存在

$cur = $this->dict[$cur][$c]; //转到对应的位置

if(isset($this->dict[$cur][$s[$i+1]])) {//检查下一个字符是否也能匹配,长度优先

$i++;

continue;

}

if(isset($this->dict[$cur]['acc'])) { //是叶子节点,单词匹配!

if($buf != '') {

$this->buffer[] = $buf;

$buf = '';

}

if($this->savematch) $this->buffer[] = substr($s, $p, $i - $p + 1); //取出匹配位置和匹配的词

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值