西瓜书——线性模型

最新推荐文章于 2023-07-30 15:26:19 发布

Broke_Leaf

最新推荐文章于 2023-07-30 15:26:19 发布

阅读量122

点赞数

分类专栏：机器学习 Python 文章标签：机器学习 python 算法

本文链接：https://blog.csdn.net/Broke_Leaf/article/details/116663892

版权

机器学习同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

Python

9 篇文章 0 订阅

订阅专栏

本章内容来源于西瓜书第三章的课后题，序号是3.3，关于西瓜书的答案，网上已经有了不少，我自己也是先按照网上西瓜书的答案进行的学习，但是后面发现网上的答案没有很好的利用书中的知识，所以自己按照书中内容，重新做了下

数据介绍

我们先介绍数据，数据如下，可以直接复制拿去用
[[ 1. , 0.697 , 0.46 , 1. ],
[ 2. , 0.774 , 0.376 , 1. ],
[ 3. , 0.634 , 0.264 , 1. ],
[ 4. , 0.608 , 0.318 , 1. ],
[ 5. , 0.556 , 0.215 , 1. ],
[ 6. , 0.403 , 0.237 , 1. ],
[ 7. , 0.481 , 0.149 , 1. ],
[ 8. , 0.437 , 0.211 , 1. ],
[ 9. , 0.666 , 0.091 , 0. ],
[10. , 0.243 , 0.0267, 0. ],
[11. , 0.245 , 0.057 , 0. ],
[12. , 0.343 , 0.099 , 0. ],
[13. , 0.639 , 0.161 , 0. ],
[14. , 0.657 , 0.198 , 0. ],
[15. , 0.36 , 0.37 , 0. ],
[16. , 0.593 , 0.042 , 0. ],
[17. , 0.719 , 0.103 , 0. ]]

代码实现

import numpy as np
from sklearn import model_selection
from sklearn import metrics
def gradDscent_2(x,y):
    max_time=500
    m,n=np.shape(x)
    beta=np.zeros(n)
    h=0.1
    delta=np.zeros(n)
    for i in range(max_time):
        beta+=delta
        delta=derivative(x,y,beta)*-h
    return beta
def derivative(x,y,beta):
    delta_l=0
    m,n=np.shape(x)
    for i in range(m):
        delta_l+=np.dot(x[i].T,(1-y[i]-(1/(1+np.math.exp(np.dot(x[i].T,beta))))))
    return delta_l
def sigmoid(x,beta):
    return 1.0/(1+np.math.exp(-1*np.dot(beta,x.T)))
def predict(x,beta):
    m,n=np.shape(x)
    y=np.zeros(m)
    for i in range(m):
        if(sigmoid(x[i],beta)>0.5):
            y[i]=1
    return y
dataset=[[ 1.    ,  0.697 ,  0.46  ,  1.    ],
       [ 2.    ,  0.774 ,  0.376 ,  1.    ],
       [ 3.    ,  0.634 ,  0.264 ,  1.    ],
       [ 4.    ,  0.608 ,  0.318 ,  1.    ],
       [ 5.    ,  0.556 ,  0.215 ,  1.    ],
       [ 6.    ,  0.403 ,  0.237 ,  1.    ],
       [ 7.    ,  0.481 ,  0.149 ,  1.    ],
       [ 8.    ,  0.437 ,  0.211 ,  1.    ],
       [ 9.    ,  0.666 ,  0.091 ,  0.    ],
       [10.    ,  0.243 ,  0.0267,  0.    ],
       [11.    ,  0.245 ,  0.057 ,  0.    ],
       [12.    ,  0.343 ,  0.099 ,  0.    ],
       [13.    ,  0.639 ,  0.161 ,  0.    ],
       [14.    ,  0.657 ,  0.198 ,  0.    ],
       [15.    ,  0.36  ,  0.37  ,  0.    ],
       [16.    ,  0.593 ,  0.042 ,  0.    ],
       [17.    ,  0.719 ,  0.103 ,  0.    ]]
dataset=np.array(dataset)
print(type(dataset))
x=dataset[:,1:3]
y=dataset[:,3]
x_train,x_test,y_train,y_test=model_selection.train_test_split(x,y,test_size=0.6,random_state=0)
beta=gradDscent_2(x_train,y_train)
pred=predict(x_test,beta)
print(metrics.confusion_matrix(y_test,pred))
print(metrics.classification_report(y_test,pred))

结果与网上答案一致，使用的公式是p60，3.30

Broke_Leaf

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
西瓜书——线性模型

本章内容来源于西瓜书第三章的课后题，序号是3.3，关于西瓜书的答案，网上已经有了不少，我自己也是先按照网上西瓜书的答案进行的学习，但是后面发现网上的答案没有很好的利用书中的知识，所以自己按照书中内容，重新做了下数据介绍我们先介绍数据，数据如下，可以直接复制拿去用[[ 1. , 0.697 , 0.46 , 1. ],[ 2. , 0.774 , 0.376 , 1. ],[ 3. , 0.634 , 0.264 , 1. ],[ 4.
复制链接

扫一扫