机器学习-对客户信息数据处理并可视化

一、实验内容

        对表4-2 客户信息数据进行数据处理,随后进行降维、聚类、可视化。

 表4-2 客户信息数据

 

二、实验步骤

1. 读取数据

import numpy as np
import pandas as pd
from pandas import Series,DataFrame
data=pd.read_excel('./4-2 客户信息数据.xlsx')
print(pd.read_excel('./4-2 客户信息数据.xlsx'))

执行结果如下:

2. 去除唯一属性

del data['编号']
del data['姓名']
print(data)

执行结果如下:

3. 对属性进行编码

data = [[36,50000,4,41000,1,1],
        [42,45000,4,40000,2,1],
        [23,31000,2,35000,3,2],
        [61,70000,4,20000,4,3],
        [38,20000,3,10000,2,4]]
print(data)

执行结果如下:

 4. 数据归一化

np.set_printoptions(suppress=True)
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaler.fit(data)
MinMaxScaler(copy=True,feature_range=(0,1))
print(scaler.transform(data))

执行结果如下:

 5. 降维-4个维度

from sklearn.decomposition import PCA
pca=PCA(n_components=4)
reduced_x=pca.fit_transform(data)

6. 聚类 (K-Means算法)

from sklearn.cluster import KMeans
from sklearn.metrics import fowlkes_mallows_score
data_target=[1,1,0,1,0.5]
for i in range(1,4):
    kmeans=KMeans(n_clusters=i,random_state=123).fit(reduced_x)
    score=fowlkes_mallows_score(data_target,kmeans.labels_)
    print('聚{}类,FMI评价分值为{}'.format(i,score))

执行结果如下:

7. 可视化

import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
red_x,red_y=[],[]
blue_x,blue_y=[],[]
green_x,green_y=[],[]
y=[1,1,0,1,0,1]
for i in range(len(reduced_x)):
    if y[i]==1:
        red_x.append(reduced_x[i][0])
        red_y.append(reduced_x[i][1])
    elif y[i]==0:
        blue_x.append(reduced_x[i][0])
        blue_y.append(reduced_x[i][1])
plt.scatter(red_x,red_y,marker='x')
plt.scatter(blue_x,blue_y,marker='D')
plt.show()

 执行结果如下:

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Python机器学习数据分析预测可视化系统是一个基于Python编程语言的工具,用于处理和分析大量的数据,并通过机器学习算法进行预测和可视化展示。 首先,这个系统可以使用Python中的各种数据处理库(如Pandas、NumPy、SciPy等)来处理大规模的数据集。这些库提供了丰富的函数和方法,方便用户进行数据清洗、处理和转换,以便进一步的分析。 其次,机器学习算法是该系统的重要组成部分。Python提供了强大的机器学习库(如Scikit-learn、TensorFlow、Keras等),可以使用这些库中的各种算法来构建和训练机器学习模型。这些算法包括回归、分类、聚类、降维等,用于根据已有的数据来预测新的数据,并提供潜在的模式和趋势。 此外,该系统还提供了丰富的可视化工具,使用户可以通过图表、图像和动画来呈现数据和分析结果。Python的可视化库(如Matplotlib、Seaborn、Plotly等)提供了多种可视化方式,配合数据分析和预测模型的结果,可以直观地展示数据的特征和变化趋势,帮助用户更好地理解和解释数据。 最后,这个系统还具备灵活性和扩展性。Python作为一种开源的编程语言,有着庞大的社区支持和丰富的第三方库,用户可以根据自己的需求扩展和定制系统功能。此外,Python还具备跨平台的特性,可以在不同操作系统上运行。 综上所述,Python机器学习数据分析预测可视化系统是一种方便、强大和灵活的工具,可以帮助用户高效地处理和分析大规模的数据,并通过机器学习算法进行预测,并通过可视化方式直观地展示分析结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值