聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。
聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
from sklearn import linear_model
import numpy as np
#x_train=input_variables_values_training_datasets
x_train=np.random.rand(4,4)
print(x_train)
y_train=np.random.rand(4,4)
print(y_train)
x_test=np.random.rand(4,4)
#y_train=target_variables_values_training_datasets
#x_test=input_variables_values_test_datasets
linear=linear_model.LinearRegression()
linear.fit(x_train,y_train)
linear.score(x_train,y_train)
print('Coefficient:n',linear.coef_)
print('Intercept:n',linear.intercept_)
pridicted=linear.predict(x_test)
结果
[[ 0.87359125 0.47559242 0.34103848 0.35529117]
[ 0.30484304 0.1346771 0.81604251 0.14563632]
[ 0.20889247 0.57886668 0.49773625 0.94362152]
[ 0.40701201 0.08299527 0.07274083 0.45447494]]
[[ 0.32778814 0.1822781 0.39895439 0.7173133 ]
[ 0.18118345 0.13658598 0.78944753 0.58676574]
[ 0.13258091 0.26180366 0.13275631 0.27228853]
[ 0.60448597 0.20074418 0.20396177 0.79500598]]
Coefficient:n [[ 0.02352852 -0.36012963 -0.57782116 -0.08810093]
[-0.02799919 0.04668597 -0.04843523 0.10824322]
[ 0.05643129 -0.10237516 0.58390087 -0.52625452]
[ 0.23454296 -0.31139243 -0.36711571 -0.33899204]]
Intercept:n [ 0.70686949 0.16259487 0.38618627 0.90615596]