吴恩达机器学习练习六

最新推荐文章于 2020-08-10 17:02:51 发布

拾贝壳的大男孩

最新推荐文章于 2020-08-10 17:02:51 发布

阅读量223

点赞数

分类专栏：新技能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38712697/article/details/81156930

版权

新技能专栏收录该内容

16 篇文章 3 订阅

订阅专栏

SVM支持向量机

1）Gaussian kernel实现，计算两个样本的相似度，用于学习非线性边界。

sim = exp(-(x1-x2)'*(x1-x2)/(2*sigma^2));

2）找到最优的C与sigma参数

其实就是枚举，计算不同参数组合的错误率，找到最小的。

先用学习的样本进行模型学习，然后用验证集计算错误率。dataset3Params.m文件

垃圾邮件分类

邮件分类时，先提取特征，特征提取方法如下：

先把邮件里的词语做替换，将部分相似的词语替换成统一个一个词
进行词频统计，为模型学习正确性，出现少的词频不要拿来学习，否则影响精度
将选用做特征的词进行编码，转化成数字。

processEmail.m文件

for i= 1: len

if strcmp(str, vocabList{i})

word_indices =[word_indices;i];

end

其实就是做了遍历查找。

邮件向量化 emailFeatures.m 文件

indics_len = length(word_indices);

for i=1:indics_len

x(word_indices(i))=1;

end

拾贝壳的大男孩

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
吴恩达机器学习练习六

SVM支持向量机1）Gaussian kernel实现，计算两个样本的相似度，用于学习非线性边界。sim = exp(-(x1-x2)'*(x1-x2)/(2*sigma^2)); 2）找到最优的C与sigma参数其实就是枚举，计算不同参数组合的错误率，找到最小的。先用学习的样本进行模型学习，然后用验证集计算错误率。dataset3Params.m文件 ...
复制链接

扫一扫

专栏目录

拾贝壳的大男孩 CSDN认证博客专家 CSDN认证企业博客

码龄7年

28: 原创

13万+: 周排名

93万+: 总排名

8万+: 访问

: 等级

1167: 积分

76: 粉丝

62: 获赞

21: 评论

343: 收藏

私信

关注

热门文章

分类专栏

最新评论

modelsim仿真调用xilinx IP的一种方法
吉尔伯特拳打托马斯: 请问怎么通过脚本和ui建立工程啊
modelsim仿真调用xilinx IP的一种方法
ssp_loser: 大佬，有modesim 10.6b 的安装包没
Xilinx的Zynq系列，ARM和PL通过DMA通信时如何保证DDR数据的正确性。
若丑 |WTJ: 请问楼主，你这里举例的10个short无法对齐的问题通过malloc函数解决了吗
Xilinx的Zynq系列，ARM和PL通过DMA通信时如何保证DDR数据的正确性。
董程森: 您好,假如通过cache更新400个short(16bit),也就是800个bytes的话.按照算法800/32bytes(A9 core) =25 是对齐的.然后10个short(16bit),也就是20个bytes,按照算法20/32无法对齐,那么就需要在PS端地址malloc的时候,多malloc12byts,达到32bytes,这样的话就可以完美使用cache了.请问我这样的理解对吗?(最近在搞cache相关的应用,我发现如果cache不对齐(例如上文我只用了10个short)的话,将会导致每次相同输入,不同的输出.我目前考虑是cache没对齐的原因.目前正在测试.
神经网络从算法训练到FPGA部署 (1)--开发流程说明
d_e_s_t_i_n_y: 兄弟你这个问题解决没，能否加个QQ交流一下。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。