哈夫曼树与Logistic回归

最新推荐文章于 2024-07-26 13:24:37 发布

最后的菜鸡

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量56

点赞数 1

文章标签：回归数据挖掘人工智能霍夫曼树 logistics regression

本文链接：https://blog.csdn.net/qq_43248104/article/details/132604300

版权

哈夫曼树Huffman tree

一句话解释，哈夫曼树将一个softmax的多分类问题转换成了多个logistic的二分类问题
以连续词袋模型（CBOW）为例，输入多个词向量，输出层则输出最可能的w，最简的实现自然是softmax，但为了计算难度，使用哈夫曼树简化计算
$p^w$ 为从根节点到词汇w 叶子节点对应的路径
${d_j^w}$ 表示 $p^w$ 中第j个节点对应的编码，而 $\theta^w_1$ 表示路径 $p^w$ 中的参数向量
根据上述定义，我们可以写出基于Hierarchical Softmax优化的连续词袋模型（CBOW）的条件概率：
p ( w ∣ context ( w ) ) = ∏ j = 1 I w p ( d j w ∣ x w ; θ j − 1 w )
其中，每一项都是一个Logistic回归
后半部分略去，有想法在写
负采样优化每次采样一小部分，更新一个训练样本的一小部分权重

Logistic回归

用sigmoid函数模拟阶跃函数，sigmoid函数即：
$\sigma =\frac{1}{1+e^{-z}}=\frac{1}{1+e^{-w^T x}}$
定义对数几率为 $ln\frac{y}{1-y}=w^T x$
显然，y可视为正例的概率，1-y为负例的概率则
$p(y=1)=\frac{e^{w^T x}}{1+e^{w^T x}}=\frac{1}{1+e^{-w^T x}}=\sigma$
则 $p(y=0)=1-\sigma$
用梯度上升算法进行Logistic回归
$w=w+\nabla{f(w)}$
对应代码如下

import math
import numpy as np

data = []  # 特征数据
labels = []  # 目标数据


def sigmoid(x):
    sig = 1/(1+math.exp(-x))
    return sig


def grad_ascent():
    datamat = np.mat(data)
    labelsmat = np.mat(labels).transpose()
    m, n = np.shape(datamat)
    weights = np.ones(n, 1)  # 初始化weight
    alpha = 0.001
    iters = 500
    for i in range(iters):
        h = sigmoid(datamat * weights)
        error = labelsmat - h
        weights = weights + alpha * datamat.transpose() * error
    return weights

关于 $w=w+\nabla{f(w)}$ 与weights = weights + alpha * datamat.transpose() * error等价的证明
$\nabla{f(w)}=\frac{\partial error}{\partial w}=-\frac{\partial D*w}{\partial w}\cdot \frac{\partial \sigma( D*w)}{\partial (D*w)}=-D^T\sigma(D*w)[1 - \sigma(D*w)]$
略去高阶项，加入常数项得：
$\nabla{f(w)}=-D^T\sigma(D*w)=D^T(error-labels)$ 即 $\nabla{f(w)}=D^Terror$
改进的随机梯度上升算法:

# 改进的随机梯度上升算法
def stocGradAscent1(dataMatrix, classLabels, numIter=150):  # dataMatIn数据集、classLabels数据标签、numIter迭代次数
    m, n = shape(dataMatrix)                                # 获取数据集矩阵的大小，m为行数，n为列数
    weights = ones(n)                                       # 所以初始化为1
    for j in range(numIter):
        dataIndex = list(range(m))                          # 创建数据下标列表
        for i in range(m):
            alpha = 4 / (1.0 + j + i) + 0.0001              # apha目标移动的步长，每次迭代调整
            randIndex = int(random.uniform(0, len(dataIndex)))  # 随机选取更新样本
            h = sigmoid(sum(dataMatrix[randIndex] * weights))   # 矩阵相乘，计算sigmoid函数
            error = classLabels[randIndex] - h                  # 计算误差
            weights = weights + alpha * error * dataMatrix[randIndex]  # 矩阵相乘，更新权重
            del (dataIndex[randIndex])                                 # 删除已使用过的样本
    return weights

最后的菜鸡

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
哈夫曼树与Logistic回归

一句话解释，哈夫曼树将一个softmax的多分类问题转换成了多个logistic的二分类问题以连续词袋模型（CBOW）为例，输入多个词向量，输出层则输出最可能的w，最简的实现自然是softmax，但为了计算难度，使用哈夫曼树简化计算pwp^wpw为从根节点到词汇w 叶子节点对应的路径djw{d_j^w}djw表示pwp^wpw中第j个节点对应的编码，而θ1w\theta^w_1θ1w表示路径pwp^wpw中的参数向量根据上述定义，我们可以写出基于Hierarchical Softmax优化的连续
复制链接

扫一扫