编程实现之学习向量量化(LVQ)

与k均值算法类似,LVQ试图找到一组原型向量来刻画聚类结构,但是LVQ假设数据样本带有类别标记,学习过程利用样本的这些监督信息来辅助聚类。

因此我的理解是LVQ是基于监督的聚类。

根据周志华老师给出的算法步骤,我用Python编程实现了这一过程。具体代码如下:

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import random

#首先读入数据
midu = []
hantanglv = []
mark = []
df = pd.read_excel('西瓜数据集4.0.xlsx')
for i in df.index.values:
    midu.append(df.ix[i].values[1])
    hantanglv.append(df.ix[i].values[2])
for i in range(8):
    mark.append(1)
for i in range(8, 20):
    mark.append(0)
for i in range(20,30):
    mark.append(1)
    
#按照书上示例,将原型向量个数定义为5 学习率定义为0.1
q = 5
learningRate = 0.1

#随机选出q个数据作为初始原型向量
qIndex = random.sample(range(0,len(midu)), q)
P = []
for i in qIndex:
    P.append([np.array([midu[i], hantanglv[i]]), mark[i]])

#下面开始迭代 假定迭代轮数为400轮
r = 400
i = 0
for i in range(400):
    #从样本集中随机选取一个样本
    j = random.randint(0, len(midu)-1)
    dis = [np.linalg.norm(np.array([midu[j], hantanglv[j]])- p[0]) for p in P]
    #找出最近的原型向量
    minDis = dis.index(min(dis))
    #更新原型向量
    if P[minDis][1] == mark[j]:
        p_ = P[minDis][0]+learningRate*(np.array([midu[j], hantanglv[j]])- P[minDis][0])
    else:
        p_ = P[minDis][0]-learningRate*(np.array([midu[j], hantanglv[j]])- P[minDis][0])
    P[minDis][0] = p_
    
#将结果可视化
co = ['r', 'g', 'b', 'm']
for i in range(q):
    mm = [j[0][0] for j in P]
    hh = [j[0][1] for j in P]
plt.scatter(mm, hh, marker='x')
mm = [midu[i] for i in range(len(mark)) if mark[i] == 1]
hh = [hantanglv[i] for i in range(len(mark)) if mark[i] == 1]
plt.scatter(mm, hh, marker='o')
mm = [midu[i] for i in range(len(mark)) if mark[i] == 0]
hh = [hantanglv[i] for i in range(len(mark)) if mark[i] == 0]
plt.scatter(mm, hh, marker='v')
plt.show()

使用的数据集依旧是西瓜数据集4.0,最终运行结果如下所示:

画x的表示原型向量,画倒三角的表示坏瓜,画圆形的表示好瓜。因为迭代过程的随机性,每次运行结果都不太一样。

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径。 随着统计学的发展,统计学习机器学习中占据了重要地位,支持向量机(SVM)、决策树和随机森林等算法的提出和发展,使得机器学习能够更好地处理分类、回归和聚类等任务。进入21世纪,深度学习成为机器学习领域的重要突破,采用多层神经网络模型,通过大量数据和强大的计算能力来训练模型,在计算机视觉、自然语言处理和语音识别等领域取得了显著的成果。 机器学习算法在各个领域都有广泛的应用,包括医疗保健、金融、零售和电子商务、智能交通、生产制造等。例如,在医疗领域,机器学习技术可以帮助医生识别医疗影像,辅助诊断疾病,预测病情发展趋势,并为患者提供个性化的治疗方案。在金融领域,机器学习模型可以分析金融数据,识别潜在风险,预测股票市场的走势等。 未来,随着传感器技术和计算能力的提升,机器学习将在自动驾驶、智能家居等领域发挥更大的作用。同时,随着物联网技术的普及,机器学习将助力智能家居设备实现更加智能化和个性化的功能。在工业制造领域,机器学习也将实现广泛应用,如智能制造、工艺优化和质量控制等。 总之,机器学习是一门具有广阔应用前景和深远影响的学科,它将持续推动人工智能技术的发展,为人类社会的进步做出重要贡献。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值