python实现kmeans聚类不使用科学计算包_用python实现单词包模型的简单kmeans聚类

本文介绍了一种不使用科学计算包,在Python中实现KMeans聚类的方法。通过创建单词包模型,将用户与他们使用的特定词汇关联,并生成用户向量。输出显示了用户向量,如{'007': ['0', '0', '1'], '666': ['0', '1', '1'], '888': ['1', '0', '0']}。作者计划使用KMeans算法进行聚类,但对机器学习不熟悉,期望实现666和007聚为一类,888单独一类的结果。" 89241439,8173013,Java模拟登录并下载文件,"['Java开发', '网络编程', '文件下载', 'HTTP请求', '身份验证']
摘要由CSDN通过智能技术生成

输入数据集如下所示:{"666": ["abc",

"xyz"],

"888": ["xxxo",

"xxxo"],

"007": ["abc"]}

我们首先使用以下函数创建一个单词包模型:def associate_terms_with_user(unique_term_set, all_users_terms_dict):

associated_value_return_dict = {}

# consider the first user

for user_id in all_users_terms_dict:

# what terms *could* this user have possibly used

this_user_zero_vector = []

# this could be refactored somehow

for term in unique_term_set:

this_user_zero_vector.extend('0')

# what terms *did* this user use

terms_belong_to_this_user = all_users_terms_dict.get(user_id)

# let's start counting all the possible terms that this term in the personal

# user list of words could correspond to...

global_term_element_index = 0

# whi

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值