DFA算法屏蔽词

本文介绍了如何使用确定有限状态自动机(DFA)算法进行屏蔽词的高效过滤。通过DFA,可以实现对文本内容的快速扫描,有效屏蔽特定词汇,确保内容的合规性。
摘要由CSDN通过智能技术生成
<?php
/**
 * 敏感词过滤方法.
 */

SensitiveTool::saveSensitiveWord();
$res = SensitiveTool::filterSensitiveWord('旅馆1');
var_dump($res);

class SensitiveTool
{
    private static $arrHashMap = [];
    private static $file       = 'sensitive.txt';

    /**
     * 把敏感词保存为文件
     * @return bool|int
     */
    public static function saveSensitiveWord(){
        $data = [
	        '旅馆',
	        '旅店',
	        '招待所',
	        '浴池',
	        '计时休息',
	        '英租界',
	        '法租界',
	        '法租',
	        '英租',
	        '租界',
	        '饭店',
	        '宾馆',
	        '酒店',
	        '客栈',
	        '洗浴',
	        '最'
	    ];
        foreach( $data as $k => $v ){
            self::addKeyWord($v);
        }
        var_dump(self::$arrHashMap);
        return file_put_contents(self::$file,serialize(self::$arrHashMap));

    }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值