本文代码参考自:使用Python实现Mean Shift算法
#! usr/bin/env python
# coding:utf-8
"""
__author__ = "LCG22"
__date__ = "2016-11-29"
数据集:titanic.xls(泰坦尼克号遇难者/幸存者名单)
<http://blog.topspeedsnail.com/wp-content/uploads/2016/11/titanic.xls>
***字段***
pclass: 社会阶层(1,精英;2,中层;3,船员/劳苦大众)
survived: 是否幸存
name: 名字
sex: 性别
age: 年龄
sibsp: 哥哥姐姐个数
parch: 父母儿女个数
ticket: 船票号
fare: 船票价钱
cabin: 船舱
embarked
boat
body: 尸体
home.dest
******
目的:使用除survived字段外的数据进行means shift分组,看看能分为几组,这几组人有什么共同特点
"""
import numpy as np
from sklearn.cluster import MeanShift
from sklearn import preprocessing
import pandas as pd
# 加载数据
df = pd.read_excel(r"titanic.xls")
print df.shape
print "-"*100
print df.head()
print "