1.
# #********** Begin **********#
# 1.去掉指标值小于0和存在空值的记录
# 2.去掉存在异常值的记录,指标取值大于或等于8倍均值视为异常值
# 3.对指标值进行均值-方差标准化处理
# 4.对标准化后的指标值进行k-均值聚类分析,k=5,即聚为5类
# 5.返回聚类结果,用序列Fs来表示,index为股票代码、值为聚类标签值(0~4),
# 并按聚类标签值从小到大排序
def return_values():
import pandas as pd
import numpy as np
#1.数据预处理,即清洗掉<0,nan,异常值,标准化
dta=pd.read_excel('data.xlsx')
#dta=pd.to_numeric(dta.iloc[:,1],errors = 'coerce')
#dta=dta[dta.iloc[:,1].values>='0']
#dta=dta[dta.iloc[:,2].values>='0']
#dta=dta[dta.iloc[:,3].values>='0']
#dta=dta[dta.iloc[:,1]>0