《机器学习(周志华)》 习题5.5答案

本文通过编程实现标准BP(SGD)和累积BP(FullBatch)算法,在西瓜数据集上训练单隐层神经网络。模型在训练集和西瓜3.0上均达到100%准确率,证明了隐层非线性变换增强模型表达力。实验发现,隐层大小至少为2,SGD在未收敛时误差较高但训练时间更短,FullBatch则在相同时间下可能更快达到收敛。
摘要由CSDN通过智能技术生成

编程实现标准BP算法(sgd)和累积BP算法(fullbatch),在西瓜3.0上训练一个单隐层网络,并进行比较。

需要先把字符串转成数字,这里用one-hot。把二分类问题看成多分类问题的特例,然后用softmax。最终模型在训练集上可达到100%准确率,并且在西瓜3.0@上也可以达到100%,与前面的逻辑回归相比,多了一个隐层的非线性变换,模型的表达能力确实强大了很多!

经试验,隐层大小至少为2,为1时很难训练到百分之百准确率,隐层较大时,模型收敛更快。sgd和fullbatch相比,当模型还未收敛时,用同样的epoch,sgd比fullbatch误差高,但sgd时间更短。不过用同样的时间训练,sgd可能更容易达到收敛状态。

代码如下:

# coding: utf-8
import pandas as pd 
from pandas import read_csv
import theano
import theano.tensor as T 
import numpy as np 
from theano.tensor.nnet import sigmoid, softmax, binary_crossentropy
import numpy.random as rng
import time 
import random

def one_hot_encoder(data):
	diff_type = []
机器学习》是一本由周志华编写的经典教材,而王衡军可能是指这本书的具体某个版本或作者对书中习题的讲解。机器学习是一门研究如何使计算机系统自动改进其性能的学科,通常通过模式识别、数据挖掘和统计分析等方法来实现。 对于《机器学习》练习题答案,一般包括理论题目(如算法原理的理解)、编程实践题(涉及使用Python、R等语言实现模型)以及实战项目。这类资源可能会覆盖书中的各个章节内容,比如线性回归、逻辑回归、决策树、支持向量机、神经网络、深度学习等内容。解答可能涵盖理论解析、代码示例、错误调试以及结果解释。 由于具体的练习题库和答案因版本和来源不同会有所差异,你可以尝试以下途径找到它们: 1. 在书籍官方网站或作者的个人网站上查找官方提供的习题集和答案。 2. 在在线教育平台上,如Coursera、网易云课堂或者GitHub上有相关的课程资料和论坛讨论,学生或讲师可能会分享解题思路和答案。 3. 访问知名的技术问答社区,如Stack Overflow、CSDN等,有时能找到他人整理的学习笔记或解答。 4. 购买专门针对该教材编写的辅导书籍或视频教程,它们通常会提供详细的问题解答。 如果你想获取具体的问题和答案,请告诉我你需要哪一章的内容,或者列举一些典型问题类型,这样我可以帮助你更好地理解相关概念。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值