文章目录
Hi,大家好
这两年开始,各个学校对毕设的要求越来越高,难度也越来越大… 毕业设计耗费时间,耗费精力,甚至有些题目即使是专业的老师或者硕士生也需要很长时间,所以一旦发现问题,一定要提前准备,避免到后面措手不及,草草了事。
为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项目,今天要分享的新项目是
基于k-means的大数据客户细分
学长这里给一个题目综合评分(每项满分5分)
- 难度系数:4分
- 工作量:4分
- 创新点:3分刺 选题指导, 项目分享:
1 数据分析步骤
- 1、导入必要的库
- 2、了解数据
- 3、数据可视化
- 4、使用k-means 进行聚类分析
2 数据观察与预处理
2.1 引入库
import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns plt.style.use('fivethirtyeight') from sklearn.cluster import KMeans import plotly as py import plotly.graph_objects as go import warnings import os warnings.filterwarnings('ignore')
2.2 查看数据
df=pd.read_csv('/home/kesci/input/1564558710/超市数据.csv') df.head()<