《吴恩达机器学习》笔记——12 机器学习系统设计

最新推荐文章于 2024-02-04 21:52:27 发布

ziuno

最新推荐文章于 2024-02-04 21:52:27 发布

阅读量116

点赞数

分类专栏：笔记机器学习吴恩达机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ziuno/article/details/103102590

版权

笔记同时被 3 个专栏收录

34 篇文章 0 订阅

订阅专栏

12 篇文章 0 订阅

订阅专栏

吴恩达机器学习

8 篇文章 0 订阅

订阅专栏

《吴恩达机器学习》笔记——12 机器学习系统设计

1 确定执行的优先级

构建一个垃圾邮件分类器

监督学习	输入	输出
符号	$x$	$y$
描述	email的特征	-
选择	选择100个词来表明是否为垃圾邮件 $x\in\mathbb{R}^{100}$ $x_j=\left\{\begin{matrix}1 &若单词j出现在邮件中\\0&其他\end{matrix}\right.$	垃圾邮件(1)或非垃圾邮件(0)

减小误差方法	例子
收集大量数据	honeypot
用更复杂的特征向量描述邮件	邮件标头
根据邮件正文构建更复杂的特征向量	-
检测出垃圾邮件中的错误拼写	-

2 误差分析

推荐方法
通过一个简单的算法来快速地实现
画出相应的学习曲线来找出算法是否存在高偏差或高方差的问题
误差分析：观察交叉验证集的情况

3 不对称性分类的误差评估

偏斜类
一个类中的样本数与另一个类的数据相比多很多

预测类\真实类	1	0
1	True Positive	False Positive
0	False Negative	True Negative

评估	查准率(Precision( P ))	召回率(Recall( R ))	$F_1$ 值
公式	$\frac{TP}{TP+FP}$	$\frac{TP}{TP+FN}$	$2\frac{PR}{P+R}$
目标	高	高	高

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《吴恩达机器学习》笔记——12 机器学习系统设计

《吴恩达机器学习》笔记——12 机器学习系统设计1 确定执行的优先级构建一个垃圾邮件分类器监督学习输入输出符号xxxyyy描述email的特征-选择选择100个词来表明是否为垃圾邮件x∈R100x\in\mathbb{R}^{100}x∈R100xj={1若单词j出现在邮件中0其他x_j=\left\{\begin{matrix}1 &若...
复制链接

扫一扫

专栏目录

ziuno CSDN认证博客专家 CSDN认证企业博客

码龄7年

37: 原创

11万+: 周排名

112万+: 总排名

2万+: 访问

: 等级

500: 积分

10: 粉丝

23: 获赞

7: 评论

56: 收藏

私信

关注

热门文章

分类专栏

NLP面试学习
ESP32
torch 3篇
强化学习 2篇
论文 1篇
AllenNLP 2篇
NLP 14篇
笔记 34篇
BERT
NLPCamp 2篇
模型 3篇
吴恩达机器学习 8篇
机器学习 12篇
Tensorflow 1篇
可视化 1篇

最新评论

PyLucene安装
B ! UE: 答主说的有误，或许版本不同，lucene是可以安装在不同的环境下的，只需要在makefile里指定python的路径就可以
reinforcement_q_learning—解读
m0_69382521: 感谢博主分享，很棒的文章，小菜鸟求带，可以加你微信随时和您交流吗
NLP-2021-调研
不正经的kimol君: 大佬，我准备跟你混了！
《机器学习》阅读笔记（二）
梦逸清尘: 为什么测试错误率实际上并不独立，会导致过高估计假设成立的概率呢？
BERT-中文-Classifier-实战
B c c· 回复 ziuno: 谢谢您

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。