機器學習基石 (Machine Learning Foundations) 作业1 Q15-17的C++实现

最新推荐文章于 2022-07-26 08:11:22 发布

Mac Jiang

最新推荐文章于 2022-07-26 08:11:22 发布

阅读量1.3w

点赞数 5

分类专栏：機器學習基石 Mac Jiang的机器学习专栏文章标签：機器學習基石作业1 PLA C++实现 Q15-17

本文链接：https://blog.csdn.net/a1015553840/article/details/50979434

版权

大家好，我是Mac Jiang。今天和大家分享Coursera-台湾大学-機器學習基石 (Machine Learning Foundations) -作业1的Q15-17题的C++实现。这部分作业的任务主要是写一个PLA分类器，用于解决一个4维数据的分类问题。我的代码也许能较好的运行PLA算法，但它不一定是最好最快的实现过程，如果各位博友有更好的思路，请留言联系，谢谢！希望我的博客能给您带来一些学习上的帮助!
其他解答请看汇总帖：http://blog.csdn.net/a1015553840/article/details/51085129

PLA是一种十分简单，快速的分类算法，有速度快、实现简单的特点，特别适用于样本是线性可分的情况。对于线性可分的样本，PLA的实现过程为：
{
1.寻找w(t)的下一个错误分类点（x,y）（即sign（w(t)’*x）！=y）；
2.纠正错误：w(t+1) = w(t) + y*x；
}until(每个样本都无错)

1.第15题
这里写图片描述
（1）题意：从https://d396qusza40orc.cloudfront.net/ntumlone%2Fhw1%2Fhw1_15_train.dat 下为训练数据，他的x是4维的，而且这个数据集是线性可分的，编写PLA算法进行分类，问迭代多少次后算法结束？
（2）代码实现

#include<fstream>
#include<iostream>
#include<vector>
using namespace std;

#define DEMENSION 5

double weight[DEMENSION];//权重值
int step = 0;//修改次数
int n = 0;//训练样本数
char *file = "training_data.txt";//读取文件名

//存储训练样本，input为x，output为y
struct record{
    double input[DEMENSION];
    int output;
};

//把记录存在向量里而不是存在结构体数组内，这样可以根据实际一项项添加
vector<record> trainingSet;

//将数据读入训练样本向量中
void getData(ifstream &datafile)
{
    while(!datafile.eof())
    {
        record curRecord;
        curRecord.input[0] = 1;
        int i;
        for(i = 1; i < DEMENSION; i++){
            datafile>>curRecord.input[i];
        }
        datafile>>curRecord.output;
        trainingSet.push_back(curRecord);
    }
    datafile.close();
    n = trainingSet.size(); 
}

//计算sign值
int sign(double x){
    if(x <= 0)return</

最低0.47元/天解锁文章

Mac Jiang

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
8
评论
機器學習基石 (Machine Learning Foundations) 作业1 Q15-17的C++实现

大家好，我是Mac Jiang。今天和大家分享Coursera-台湾大学-機器學習基石 (Machine Learning Foundations) -作业1的Q15-17题的C++实现。这部分作业的任务主要是写一个PLA分类器，用于解决一个4维数据的分类问题。我的代码也许能较好的运行PLA算法，但它不一定是最好最快的实现过程，如果各位博友有更好的思路，请留言联系，谢谢！希望我的博客能给您带来一些学
复制链接

扫一扫