机器学习5-自己的第一个分类器

最新推荐文章于 2023-01-04 20:16:12 发布

扑满大师

最新推荐文章于 2023-01-04 20:16:12 发布

阅读量314

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/u013782762/article/details/55000741

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

python 代码

# coding=utf-8
import random
from sklearn.datasets import load_iris

# 获取鸢尾数据
iris = load_iris()

X = iris.data
y = iris.target

# 评分公式
from sklearn.metrics import accuracy_score

# 乱写的一个分类器
# 评分大概
class MyClf():
    def fit(self,train_data,train_target):
        self.train_data = train_data
        self.train_target = train_target


    def predict(self,test_data):
        predictions = []
        for data in test_data:
            # 随机返回一个结果值
            target = random.choice(self.train_target)
            predictions.append(target)
        return predictions

# 使用k-neighbors原理写的分类器
# 此处为了简单，k取值1
from scipy.spatial import distance

def euc(a,b):
    return distance.euclidean(a,b)

class MyClf2():
    def fit(self,train_data,train_target):
        self.train_data = train_data
        self.train_target = train_target


    def predict(self,test_data):
        predictions = []
        for data in test_data:
            # 随机返回一个结果值
            target = self.closest(data)
            predictions.append(target)
        return predictions

    def closest(self,row):
        best_dis = euc(row,self.train_data[0])
        best_idx = 0

        for x in xrange(1,len(self.train_data)):
            curr_dis = euc(row,self.train_data[x])
            if best_dis>curr_dis:
                best_idx=x
                best_dis=curr_dis
                pass
        return self.train_target[best_idx]

# cross_validation 改成 model_selection
# 前者好像是版本问题，过期了
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=.3)

clf = MyClf()
clf.fit(X_train,y_train)
predictions = clf.predict(X_test)
# print predictions
# 评分大概在.3，因为target就3个值
print 'myclf score:',accuracy_score(y_test,predictions)


clf = MyClf2()
clf.fit(X_train,y_train)
predictions = clf.predict(X_test)
# print predictions
print 'myclf2 score:',accuracy_score(y_test,predictions)

截图

这里写图片描述

我们自己写的分类器的正确率到了97%

扑满大师

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习5-自己的第一个分类器

python 代码# coding=utf-8import randomfrom sklearn.datasets import load_iris# 获取鸢尾数据iris = load_iris()X = iris.datay = iris.target# 评分公式from sklearn.metrics import accuracy_score# 乱写的一个分类器# 评分大概cl
复制链接

扫一扫