python中valueerror是什么意思_python – ValueError:标签数为1.使用silhouett...

在尝试使用K-Means进行文本聚类并计算剪影得分时,遇到了ValueError:Number of labels is 1. 有效值为2到n_samples - 1(包括)。错误出现在`silhouette_score`函数中。代码从CSV文件加载数据,使用Doc2Vec预处理文本,并在不同簇数上应用K-Means。问题可能在于簇的数量设置不正确。
摘要由CSDN通过智能技术生成

我正在尝试计算剪影得分,因为我找到了要创建的最佳簇数,但得到的错误表明:

ValueError: Number of labels is 1. Valid values are 2 to n_samples - 1 (inclusive)

我无法理解这个原因.这是我用来聚类和计算轮廓分数的代码.

我读了包含要聚类的文本的csv,并在n个簇值上运行K-Means.可能是我收到此错误的原因是什么?

#Create cluster using K-Means

#Only creates graph

import matplotlib

#matplotlib.use('Agg')

import re

import os

import nltk, math, codecs

import csv

from nltk.corpus import stopwords

from gensim.models import Doc2Vec

from sklearn.cluster import KMeans

import matplotlib.pyplot as plt

import pandas as pd

from sklearn.metrics import silhouette_score

model_name = checkpoint_save_path

loaded_model = Doc2Vec.load(model_name)

#Load the test csv file

data = pd.read_csv(test_filename)

overview = data['overview'].astype('st

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值