x

def createDataSet():

x

x

KNeighborsClassifier(algorithm='brute', leaf_size=30, metric='minkowski',
           metric_params=None, n_jobs=1, n_neighbors=5, p=2,
           weights='uniform')

x

y_predict = knn.predict(x_test.reshape(1,-1))

array(['B'], dtype=object)

probility = knn.predict_proba(x_test.reshape(1,-1))

array([[ 0.4,  0.6]])

probility.argmax()

1

# 距离升序排列

array([[3, 2, 4, 1, 0]], dtype=int64)

import numpy as np

group = DataFrame([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]], columns=['feature_1', 'feature_2'])

labels = DataFrame(['A','A','B','B'], columns=['labels'])

# 效果相同

data_set['feature_1']

0    1.0
1    1.0
2    0.0
3    0.0
Name: feature_1, dtype: float64

data_set.ix[0]

feature_1      1
feature_2    1.1
labels         A
Name: 0, dtype: object

data_set['feature_1'][0]

1.0

data_set.ix[0]['feature_1']

1.0

data_set.iloc[0]

feature_1      1
feature_2    1.1
labels         A
Name: 0, dtype: object

data_set.iloc[0, :]

feature_1      1
feature_2    1.1
labels         A
Name: 0, dtype: object

data_set.iloc[:, 0]

0    1.0
1    1.0
2    0.0
3    0.0
Name: feature_1, dtype: float64

data_set.iloc[:, 0].values

array([ 1.,  1.,  0.,  0.])

data_set.shape

(4, 3)

len(data_set.columns)

3

data_set.values

array([[1.0, 1.1, 'A'],
       [1.0, 1.0, 'A'],
       [0.0, 0.0, 'B'],
       [0.0, 0.1, 'B']], dtype=object)

data_set.iloc[:, :2].values

array([[ 1. ,  1.1],
       [ 1. ,  1. ],
       [ 0. ,  0. ],
       [ 0. ,  0.1]])

x

《机器学习实战》学习笔记（1）——k-近邻算法

1 k-近邻算法概述

2 k-近邻算法伪代码

3 欧氏距离(Euclidean Distance)

4 k-近邻算法的优点与缺点

5 Python代码实现

6 示例：约会网站相亲对象与手写数字识别系统

7 使用 pandas 和 scikit-learn 实现书上的例子