pca百分比取多少比较好_数据处理之PCA

最新推荐文章于 2024-01-01 15:15:46 发布

董德生

最新推荐文章于 2024-01-01 15:15:46 发布

阅读量734

点赞数

文章标签： pca百分比取多少比较好

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30738065/article/details/112954805

版权

本文介绍了PCA（主成分分析）的概念，通过Python实现PCA，并详细展示了如何计算特征值、特征向量，以及如何选择主成分。通过可视化展示了不同主成分解释的方差比例，强调了PC1在数据降维中的重要性。

摘要由CSDN通过智能技术生成

推荐好文PCA的数学原理

本文将会用Python来实现PCA，帮助更好的理解

1. 获取数据

我们用的数据是150个鸢尾花，然后通过4个维度刻画

%matplotlib inline

%config InlineBackend.figure_format = 'retina'

import pandas as pd

df = pd.read_csv(

filepath_or_buffer='https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data',

header=None,

sep=',')

df.columns=['sepal_len', 'sepal_wid', 'petal_len', 'petal_wid', 'class']

df.dropna(how="all", inplace=True) # drops the empty line at file-end

df.head()

X = df.ix[:,0:4].values

y = df.ix[:,4].values

现在上面数据处理后，x是一个150 * 4 的矩阵，每一行都是一个样本，y是一个 150 * 1 是向量，每个都是一个分类

我们下一步是来看3类型的花怎么分布在4个特征上，我们可以通过直方图来展示

import plotly.plotly as py

from plotly.graph_objs import *

import plotly.tools as tls

# plotting histograms

tls.set_credentials_file(username='zhuanxuhit', api_key='30dCVmghG2CqKQqfSzsu')

traces = []

legend = {0:False, 1:False, 2:False, 3:True}

colors = {'Iris-setosa': 'rgb(31, 119, 180)',

'Iris-versicolor': 'rgb(255, 127, 14)',

'Iris-virginica': 'rgb(44, 160, 44)'}

for col in range(4):

for key in colors:

traces.append(Histogram(x=X[y==key, col],

opacity=0.75,

xaxis='x%s' %(col+1),

marker=Marker(color=colors[key]),

name=key,

showlegend=legend[col]))

data = Data(traces)

layout = Layout(barmode='overlay',

xaxis=XAxis(domain=[0, 0.25], title='sepal length (cm)'),

xaxis2=XAxis(domain=[0.3, 0.5], title='sepal width (cm)'),

xaxis3=XAxis(domain=[0.55, 0.75], title='petal length (cm)'),

xaxis4=XAxis(domain=[0.8, 1], title='petal width (cm)'),

yaxis=YAxis(title='count'),

title='Distribution of the differ

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。