CRF实现词性标注（2）——python代码说明

最新推荐文章于 2024-06-04 10:43:52 发布

Amy_mm

最新推荐文章于 2024-06-04 10:43:52 发布

阅读量3.7k

点赞数

分类专栏： python 机器学习文章标签：词性标注 CRF

本文链接：https://blog.csdn.net/Amy_mm/article/details/89300230

版权

CRF原理说明请查看上篇博文
参考链接同上篇博文

定义CRF中的初始变量，包括特征函数，特征函数的权重，词性标注的label也就是状态序列，以及label_id字典。

    def __init__(self, feature_functions, labels):
        """
        :param feature_functions: 输入的特征函数
        :param labels: 输入的训练数据标注
        """
        # 特征函数
        self.ft_func = feature_functions
        # 特征函数的权值
        self.w = np.random.rand(len(self.ft_func))
        # labels
        self.labels = labels
        # label_id 的字典
        self.label_id = {
   value: idx for idx, value in enumerate(self.labels)}

定义由输入序列得到所有特征的函数。
也就是对于输入的序列X= {x1, x2,…x3}，得到每一个元素 $x_{i}$ 中 $y_{j-1},y_{j}）$ 组合的所有特征 $f_{k}$

（1）先遍历所有的特征函数，得到组合 $y_{j-1},y_{j}）$ 的所有特征函数；
（2）遍历y也就是labels，得到 j-1时刻 $y_{j-1}$ 的下一时刻的所有可能 y
（3）遍历labels得到所有可能的 $y_{j-1}$
（4）输入序列的长度为T，得到每一个时刻 $\in（0，T）$ 的所有特征。

    def get_all_features(self, x_vec)

最低0.47元/天解锁文章

Amy_mm

关注

0
点赞
踩
17

收藏

觉得还不错? 一键收藏
3
评论
CRF实现词性标注（2）——python代码说明

CRF原理说明请查看上篇博文https://blog.csdn.net/Amy_mm/article/details/89219584参考链接同上篇博文定义CRF中的初始变量，包括特征函数，特征函数的权重，词性标注的label也就是状态序列，以及label_id字典。 def __init__(self, feature_functions, labels): ...
复制链接

扫一扫

专栏目录