实验内容:
绘制主成分分析图,将高维数据呈现于低维空间中。
实验要求:
自选高维多元数据集,绘制主成分分析图;
说明数据集来源,详细介绍数据集内容;
添加椭圆标定不同数据类别。
实验目的:
掌握主成分分析图的绘制方法,理解主成分分析法的投影原理。
iris = datasets.load_iris()
x_reduced = PCA(n_components=2).fit_transform(iris.data)
target=pd.Categorical.from_codes(iris.target,iris.target_names)
df=pd.DataFrame(dict(pca1=x_reduced[ : , 0],pca2=x_reduced[ :,1],target=target))
base_plot2=(ggplot(df,aes( 'pca1' , 'pca2',fill='factor(target)' )) +
geom_point (alpha=1,size=3,shape='o' ,colour='k')+
stat_ellipse( geom="polygon",level=0.95,alpha=0.2) +
scale_fill_manual(values=("#00AFBB","#E7B800","#FC4E07" ), name='group')+
theme(
axis_title=element_text(size=15,face="plain",color="black"),
axis_text = element_text(size=13,face="plain",color="black"),
legend_text = element_text(size=11,face="plain" ,color="black"),
aspect_ratio =1,
figure_size = (5,5),dpi = 100
)
)
print(base_plot2)