機器學習基石作业1 Q15-17 感知器学习算法 (PLA) 的Python实现

weixin_45855612

已于 2022-03-15 23:19:19 修改

阅读量1.4k

点赞数

文章标签：机器学习 python 深度学习

于 2022-03-15 23:16:59 首次发布

本文链接：https://blog.csdn.net/weixin_45855612/article/details/123515110

版权

这段代码展示了如何用Python实现朴素贝叶斯分类器的训练过程，通过迭代调整权重w，直到误分类样本数降到最低。平均需要42.16次迭代完成训练。同时，注意到`np.dot`和`Series.dot`在矩阵乘法操作上的区别：前者可以正常工作，而后者会导致错误。

摘要由CSDN通过智能技术生成

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

names = ["x1", "x2", "x3", "x4", "y"]
df = pd.read_csv("~/Documents/PLA.csv", names=names)
df.insert(0, "x0", 1)

timels=[]
for i in range(100):
    w = pd.Series([0, 0, 0, 0, 0], index=["x0", "x1", "x2", "x3", "x4"]); times = 1; # wl = []
    # wl.append(w)
    mis_p = df[df["y"]==+1][np.dot(df[df["y"]==+1].iloc[:,0:df.shape[1]-1], w) <= 0]
    mis_n = df[df["y"]==-1][np.dot(df[df["y"]==-1].iloc[:,0:df.shape[1]-1], w) > 0]
    mis = pd.concat([mis_p, mis_n], axis=0)
    length = mis.shape[0]
    while length > 0:
        mis_point = mis.iloc[np.random.randint(length),:]
        w = w + mis_point["y"] * mis_point.iloc[0: mis_point.shape[0]-1]
        mis_p = df[df["y"]==+1][np.dot(df[df["y"]==+1].iloc[:,0:df.shape[1]-1], w) <= 0]
        mis_n = df[df["y"]==-1][np.dot(df[df["y"]==-1].iloc[:,0:df.shape[1]-1], w) > 0]
        mis = pd.concat([mis_p, mis_n], axis=0)
        length = mis.shape[0]
        times += 1; # wl.append(w)
        if times > 50000 :
            print("over 50000 times loops")
            break
    timels.append(times)

ts = pd.Series(timels)
ts.plot()
print(ts.mean())

平均 42.16 次

另外发现一个有意思的点:

w = pd.Series([0, 0, 0, 0, 0])
np.dot(df[df["y"]==+1].iloc[:,0:df.shape[1]-1], w)  # 可行
w.dot(df[df["y"]==+1].iloc[:,0:df.shape[1]-1]) # 报错

weixin_45855612

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫