机器学习-笔记

最新推荐文章于 2022-08-23 10:12:39 发布

nn0821

最新推荐文章于 2022-08-23 10:12:39 发布

阅读量256

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/nn0821/article/details/71189469

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

机器学习定义：计算机程序在经验（E）学习中，优化算法的性能（P）。

用机器学习先明确目标：在什么样的假设情况下解决什么问题。

用模型前要假设数据分布。

分类和回归的区别是离散还是连续。

在特征互相独立时，朴素贝叶斯是最优分类器。

0频问题：某些事件一次也未发生，在用贝叶斯统计时候，就会出现概率为0的问题。违背朴素贝叶斯基本假设，输出依赖于所有假设。

解决方法：数据平滑。

拉普拉斯估计：每个计数都加一。会引发的问题，在小数据量的时候就会严重偏离真实概率。
图灵估计。r*=(r+1)·n(下标r+1)/n(下标r)。nr是历史数据中发生r次的时间的个数。

贝叶斯要好好研究。

聚类目标：簇内相似，簇间差异。

k均值的问题：k选几，k的初始位置，距离算法。

协同过滤本质也是聚类。

数据预处理可以用图形化去离群值。

连续数据离散化可以分段打标签，比如年龄段。

解决正负样本不均：

正：负，一般，2:1,3:1

方法：

超采样，量少的重复。
低采样。

用模型前要假设数据分布。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

nn0821

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

机器学习知识点全面总结

专注大数据与人工智能技术分享，欢迎私信加群互相学习！

04-12

13万+

机器学习按照模型类型分为监督学习模型、无监督学习模型和概率模型三大类,文章对十大机器学习算法进行详细介绍并阐述机器学习其他概念问题，可作为机器学习初学者学习使用。

机器学习-西瓜书笔记汇总1

08-03

1绪论傍晚小街路面上沁出微雨后的湿润，和熙的细风吹来，抬头看看天边的晚霞，嗯，明天又是一个好天气。走到水果摊旁，挑了个根蒂蜷缩、敲起来声音浊响的青绿西瓜，一边满

参与评论您还未登录，请先登录后发表或查看评论

游戏编程精粹目录

长歌行

02-19

1万+

游戏编程精粹1 第1章　通用编程技术 1.0　神奇的数据驱动设计(Steve Rabin)　3 1.0.1　点子1——基础　3 1.0.2　点子2——最低标准　3 1.0.3　点子3——杜绝硬编码　3 1.0.4　点子4——将控制流写成脚本　4 1.0.5　点子5——什么时候不适合使用脚本？　5 1.0.6　点子6——避免重复数据　5 1.0.7　点子7——开发工具来生成数

开放世界游戏中的大地图背后有哪些实现技术？

u013790419的专栏

11-19

9197

一、程序技术篇：算法和架构（Programming Algorithms & Architecture） 1. 无限循环的平铺地图（Infinite Tiling）2. 可预测随机数和无限宇宙（Predictable Random）3. 精度问题解决方案4. 超大地形的处理（Terrain Visualization） 4.1 古典算法（从 GeoMipMapping，Progres

【游戏精粹】AI-初幕·终焉

Evil_Carl的博客

12-01

239

详情请翻阅《游戏编程精粹》系列丛书，原文虽然会稍难些，但是顾及方方面面且点明了各个技术的出处（包括技术所属公司、引用论文出处等）。如果对书中的名词不懂想了解的，建议去外网Google搜索。对于AI来说，优化是最重要的。优化会始终贯彻整个游戏的开发，在AI系统（一）：优化策略一文中提到了11个简单而实用的策略：使用事件驱动行为而非轮询；减少重复计算；由管理员集中进行协调；不那么频繁的运行AI；将处理工作分散到多帧中完成；利用细节级AI；只解决问题的一部分...

【吴恩达机器学习-笔记整理】课程知识点汇总（按视频章节）与学习笔记分享（附链接）

怪&的个人博客

08-23

1112

一、分享最近学完了B站了：[中英字幕]吴恩达机器学习系列课程共19章，112个视频。关于《机器学习》，收获颇丰，特来分享与总结，方便学习与回顾。学习笔记会持续更新，会在此文中附上对应章节学习笔记文章链接。二、课程学习一览（章节知识点总结） “P数字-P数字”对应视频的目录。若需要学某一知识，看对应章节视频即可~ 1、章节目录及知识点整理 P1-P4：介绍什么是机器学习、监督学习、无监督学习 P5-P11：代价函数，线性回归的梯度下降 P12-P17：线性代数知识（矩阵乘法，逆，转置） P18

机器学习入门-西瓜书总结笔记

weixin_45867990的博客

03-23

4845

西瓜书第一章-绪论First step引言+基本术语假设空间归纳偏好发展历程与应用现状 First step 对于西瓜书内容做总结笔记，以下都是个人总结，如果有错误欢迎指证。引言+基本术语 “模型” （model）从数据中产生 “学习算法”（learning alogrithm）从数据中产生模型的算法 ”数据集“（data set) 示例（instance）或样例（sample）的集合 “属性”（atrribute）或 "特征”（feature）反映事件或对象在某方面的表现或性质的事项 “属

吴恩达 - 机器学习课程笔记（持续更新）

热门推荐

做一只猫的博客

02-26

3万+

吴恩达机器学习

【《2021机器学习-李宏毅》学习笔记】

chh13502的博客

11-08

1万+

台湾大学李宏毅老师开设的《机器学习》近年来广受好评，成为国内众多深度学习/人工智能的学生/爱好者的入门第一课。本文给出个人在学习过程中所做的笔记总结，希望能帮到大家。

量子机器学习--学习笔记

qq_38135755的博客

07-08

2421

量子机器学习

机器学习--降维

jiangchao98的博客

04-21

2582

降维（Dimensionality Reduction）视频参考：【机器学习】【白板推导系列】【合集 1～33】_哔哩哔哩_bilibili 笔记参考：降维 · 语雀 (yuque.com) 过拟合增加数据正则化降维直接降维（特征选择）线性降维（PCA、MDS）非线性降维（流形学习（Isomap、LLE））维度灾难（数据稀疏性）：几何角度对于高维空间而言，维度越高，球形体的体积越小样本均值 & 样本方差矩阵表示存在N个数据，其中每个数.

《机器学习-周志华》学习笔记

10-17

为了训练一个真正有效、优化的模型，需要学习一下机器学习的理论知识。周志华的教材非常经典，但概念较多，特别是前两章，在学习中作了笔记，现分享出来，希望能有帮助。

吴恩达-机器学习-个人笔记完整版

12-15

这份"吴恩达-机器学习-个人笔记完整版"包含了该课程的主要知识点，以及作者对这些知识的理解和补充，对于想要深入学习或复习机器学习的人来说是一份宝贵的资源。首先，笔记可能从机器学习的基本概念开始，如监督...

机器学习-SVM-mas笔记

08-12

机器学习_SVM-mas笔记

周志华《机器学习》学习笔记（大全）

03-06

本文为周志华《机器学习》的学习笔记，记录了本人在学习这本书的过程中的理解思路以及一些有助于消化书内容的拓展知识，笔记中参考了许多网上的大牛经典博客以及李航《统计学习》的内容，向前辈们和知识致敬！

考研复习-英语二真题考试题集-带答案

09-14

英语二考研真题复习资料，带答案版

2024中美独角兽公司发展分析报告.pdf

09-14

全球各大洲独角兽企业分布、中美独角兽企业对比（数量、估值、新增及退榜情况、行业分布、所在城市）、

C++ 中的异步编程模型是什么

09-14

在C++中，异步编程模型是处理并发任务、提高程序性能和响应性的关键技术。以下是C++中实现异步编程的几种主要方式：每种异步编程模型都有其适用场景和优缺点。选择合适的模型可以提高代码的可读性、可维护性和性能。随着C++标准的不断发展，异步编程模型也在不断进化，为开发者提供了更多的工具和选择。在实际开发中，应根据具体需求选择合适的异步编程模型。例如，对于简单的异步任务，回调函数可能是最直接的选择；而对于需要结构化错误处理和结果获取的复杂异步任务，std::async和std::future可能更合适；在需要高效资源管理的场景下，线程池是一个不错的选择；而对于需要编写大量异步代码的现代应用程序，协程提供了一种更简洁、更直观的解决方案。总之，C++中的异步编程模型是多核和高并发环境下提高程序性能的重要工具。通过合理使用这些模型，开发者可以构建出更高效、更可靠的软件系统。

正则表达式Regex是一种文本模式.docx