DM11---数据可视化[图片数字]

最新推荐文章于 2022-11-28 11:43:57 发布

happyprince

最新推荐文章于 2022-11-28 11:43:57 发布

阅读量593

点赞数 1

分类专栏：数据挖掘文章标签： TSNE

本文链接：https://blog.csdn.net/ld326/article/details/79534036

版权

数据挖掘专栏收录该内容

31 篇文章 1 订阅

订阅专栏

基于TSNE可视化
例子01：

import matplotlib
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from sklearn.decomposition import PCA
from sklearn.manifold import TSNE

train_df = pd.read_csv("../data/d_train.csv")
valid_df = pd.read_csv("../data/d_test.csv")

X = train_df.loc[0:5000, 'pixel0':'pixel783']
y = train_df.label

print(train_df.shape)

print('pca...')
pca = PCA(n_components=30)
X_pca = pca.fit_transform(X)

print('tsne...')
tsne = TSNE()
X_tsne = tsne.fit_transform(X_pca[:5000])
matplotlib.rcParams['figure.figsize'] = (10.0, 10.0)
proj = pd.DataFrame(X_tsne)
proj.columns = ['comp_1', 'comp_2']
proj['labels'] = y
print('lmplot...')
sns.lmplot("comp_1", "comp_2", hue="labels", data=proj.sample(2000), fit_reg=False)
plt.title('Digit Distribution')
plt.show()

可视化显示：
这里写图片描述
例子2：
import matplotlib.pyplot as plt
import pandas as pd
train_df = pd.read_csv(“../data/d_train.csv”)
valid_df = pd.read_csv(“../data/d_test.csv”)

X = train_df.loc[0:5, ‘pixel0’:’pixel783’]
X = X / 255.0
X = X.values.reshape(-1, 28, 28, 1)

fig = plt.figure()
ax = fig.add_subplot(221)
ax.imshow(X[0][:, :, 0])
ax = fig.add_subplot(222)
ax.imshow(X[1][:, :, 0])
ax = fig.add_subplot(223)
ax.imshow(X[2][:, :, 0])
ax = fig.add_subplot(224)
ax.imshow(X[3][:, :, 0])

plt.show()
这里写图片描述