PCA模型原生python实现

最新推荐文章于 2023-11-22 20:58:09 发布

wcc8848

最新推荐文章于 2023-11-22 20:58:09 发布

阅读量1.7k

点赞数 1

分类专栏：机器学习文章标签：自然语言处理

本文链接：https://blog.csdn.net/wcc8848/article/details/124461656

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

#使用梯度上升法

import numpy as np
import matplotlib.pyplot as plt


X = np.empty((100,2))  ##返回一个100X2的数组                      ##size为样本个数
X[:,0] = np.random.uniform(0.,100.,size =100)#随机生成100个实数在（0-100）范围内个数
X[:,1] = 0.75*X[:,0] + 3.+ np.random.normal(0,10., size =100)#正态分布
# print(X)
# print(X[:,0])
# print(X[:,1])
plt.scatter(X[:,0],X[:,1])
plt.show()


##去中心化
#demean
def demean(X):
    return X-np.mean(X, axis= 0)

X_demean = demean(X)

plt.scatter(X_demean[:,0],X_demean[:,1])
plt.show()

#梯度上升法

def f(w,X):
    return np.sum((X.dot(w)**2))/len(X)

#dot函数：运算时直接进行乘积
# 二维数组（矩阵）之间的运算，则得到的是矩阵积（mastrix product）
def df_math(w,X):
    return X.T.dot(X.dot(w))*2./len(X)
def df_debug(w,X, epsilon = 0.0001):
    res = np.empty(len(w))
    for i in range(len(w)):
        w_1 = w.copy()
        w_1[i] += epsilon
        w_2 = w.copy()
        w_2[i] -= epsilon
        res[i] = (f(w_1,X) - f(w_2,X)) / (2 * epsilon)
    return res
def direction(w):
    return w/ np.linalg.norm(w)
#np.linalg.norm：求范数，默认情况下，是求整体的矩阵元素平方和，再开根号
def gradient_ascent(df,X,initial_w,eta,n_iters = 1e4,epsilon = 1e-8):
    w = direction(initial_w)
    cur_iter = 0
    while cur_iter<n_iters:
        gradient = df(w,X)##梯度
        last_w = w
        w = w + eta*gradient
        w = direction(w) #每次求一个单位方向
        if(abs( f(w,X) - f(last_w,X))<epsilon):
            break
        cur_iter += 1


    return w  #求主成分w
initial_w = np.random.random(X.shape[1]) #注意不能从零向量开始
# print(initial_w)

eta = 0.001

gradient_ascent(df_debug,X_demean,initial_w,eta)
print(gradient_ascent(df_debug,X_demean,initial_w,eta))

gradient_ascent(df_math,X_demean,initial_w,eta)
print(gradient_ascent(df_math,X_demean,initial_w,eta))

w =gradient_ascent(df_math,X_demean,initial_w,eta)


plt.scatter(X_demean[:,0],X_demean[:,1])
plt.plot([0,w[0]*30],[0,w[1]*30],color = 'r')
plt.show()



X2 = np.empty((100, 2))
X2[:,0] = np.random.uniform(0., 100., size=100)
X2[:,1] = 0.75 * X2[:,0] + 3.

#%%

plt.scatter(X2[:,0], X2[:,1])
plt.show()

#%%

X2_demean = demean(X2)

#%%

w2 = gradient_ascent(df_math, X2_demean, initial_w, eta)

#%%

plt.scatter(X2_demean[:,0], X2_demean[:,1])
plt.plot([0, w2[0]*30], [0, w2[1]*30], color='r')
plt.show()

wcc8848

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PCA模型原生python实现

#使用梯度上升法import numpy as npimport matplotlib.pyplot as pltX = np.empty((100,2)) ##返回一个100X2的数组 ##size为样本个数X[:,0] = np.random.uniform(0.,100.,size =100)#随机生成100个实数在（0-100）范围内个数X[:,1] = 0.75*X[:,0] + 3.+ np.random.normal(0,10., .
复制链接

扫一扫