機器學習基石作业1 Q15-17 感知器学习算法 (PLA) 的Python实现

这段代码展示了如何用Python实现朴素贝叶斯分类器的训练过程,通过迭代调整权重w,直到误分类样本数降到最低。平均需要42.16次迭代完成训练。同时,注意到`np.dot`和`Series.dot`在矩阵乘法操作上的区别:前者可以正常工作,而后者会导致错误。
摘要由CSDN通过智能技术生成

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

names = ["x1", "x2", "x3", "x4", "y"]
df = pd.read_csv("~/Documents/PLA.csv", names=names)
df.insert(0, "x0", 1)

timels=[]
for i in range(100):
    w = pd.Series([0, 0, 0, 0, 0], index=["x0", "x1", "x2", "x3", "x4"]); times = 1; # wl = []
    # wl.append(w)
    mis_p = df[df["y"]==+1][np.dot(df[df["y"]==+1].iloc[:,0:df.shape[1]-1], w) <= 0]
    mis_n = df[df["y"]==-1][np.dot(df[df["y"]==-1].iloc[:,0:df.shape[1]-1], w) > 0]
    mis = pd.concat([mis_p, mis_n], axis=0)
    length = mis.shape[0]
    while length > 0:
        mis_point = mis.iloc[np.random.randint(length),:]
        w = w + mis_point["y"] * mis_point.iloc[0: mis_point.shape[0]-1]
        mis_p = df[df["y"]==+1][np.dot(df[df["y"]==+1].iloc[:,0:df.shape[1]-1], w) <= 0]
        mis_n = df[df["y"]==-1][np.dot(df[df["y"]==-1].iloc[:,0:df.shape[1]-1], w) > 0]
        mis = pd.concat([mis_p, mis_n], axis=0)
        length = mis.shape[0]
        times += 1; # wl.append(w)
        if times > 50000 :
            print("over 50000 times loops")
            break
    timels.append(times)

ts = pd.Series(timels)
ts.plot()
print(ts.mean())

平均 42.16 次

另外发现一个有意思的点:

w = pd.Series([0, 0, 0, 0, 0])
np.dot(df[df["y"]==+1].iloc[:,0:df.shape[1]-1], w)  # 可行
w.dot(df[df["y"]==+1].iloc[:,0:df.shape[1]-1]) # 报错

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值