我喝AD钙-CSDN博客

原创机器学习西瓜书笔记(十四) 第十四章概率图模型

概率图模型是一类用图表示变量之间关系的概率模型，包括有向图模型（如贝叶斯网）和无向图模型（如马尔可夫随机场）。这些模型在推断和学习参数方面有广泛应用，如隐马尔可夫模型（HMM）在时序数据建模中的应用，条件随机场（CRF）在序列标注任务中的应用，以及话题模型如LDA在文本挖掘中的应用。推断方法包括精确推断（如变量消去和信念传播）和近似推断（如MCMC采样和变分推断），而参数学习通常使用极大似然或最大后验概率估计。这些模型和方法在信息检索、自然语言处理等领域发挥着重要作用。

2024-10-07 21:24:30 1400

原创机器学习西瓜书笔记(十三) 第十三章半监督学习+代码

协同训练算法本身是为多视图数据而设计的，但此后出现了一些能在单视图数据上使用的变体算法，它们或是使用不同的学习算法，或使用不同的数据采样，甚至使用不同的参数设置来产生不同的学习器，也能有效地利用未标记数据来提升性能。这些方法通过不同的策略来挖掘未标记数据的潜力，如主动学习通过选择性地获取样本标签来优化模型，半监督学习则直接结合少量标记样本和大量未标记样本进行训练，而基于分歧的方法则利用多个学习器之间的差异来提升性能。通过图结构，算法能够捕捉数据的内在结构，实现更准确的标签预测，并提升模型的泛化能力。

2024-10-02 09:53:13 1283

原创机器学习西瓜书笔记(十一) 第十一章特征选择与稀疏学习+代码

一般而言，由于包裹式特征选择方法直接针对给定学习器进行优化，因此从最终学习器性能来看，包裹式特征选择比过滤式特征选择更好，但另一方面，由于在特征选择过程中需多次训练学习器，因此包裹式特征选择的计算开销通常比过滤式特征选择大得多。因此，在实际应用中，需要根据问题的特点和计算资源的可用性来权衡使用包裹式特征选择的利弊。与过滤式特征选择不考虑后续学习器不同，包裹式特征选抒直接把最终将要使用的学习器的性能作为特征子集的评价准则换言之，包裹式特征选择的目的就是为给定学习器选择最有利于其性能、"量身定做"的特征子集。

2024-09-25 20:37:52 1288

原创机器学习西瓜书笔记(十) 第十章降维与度量学习+代码

本章是关于降维与度量学习的一个概述，涵盖了多种降维技术及其原理。以下是对每个部分的简要总结和澄清：k近邻（kNN）：一种基于实例的学习算法，通过查找测试样本最近的k个训练样本来进行预测。在分类中使用投票法，在回归中使用平均法或加权方法。低维嵌入：将高维数据映射到低维空间的技术，目的是保留数据的重要结构和特征，便于分析和可视化。主成分分析（PCA）：通过正交变换将变量转换为一组线性不相关的变量，以减少数据维度同时保留数据变异性。

2024-09-15 10:35:06 1776

原创机器学习西瓜书笔记(九) 第九章聚类+代码

第九章聚类包括聚类任务的介绍、性能度量、距离计算、原型聚类、密度聚类和层次聚类等几个部分。聚类任务：聚类是无监督学习中的一种方法，旨在将数据集中的样本划分为若干个簇，使得同一簇内的样本尽可能相似，不同簇之间的样本尽可能不同。聚类结果可以揭示数据的内在结构，也可以作为其他学习任务的前处理步骤。性能度量：聚类性能度量用于评估聚类结果的好坏。内部指标直接基于聚类结果进行评估，而外部指标则需要一个参考模型进行比较。常见的内部指标包括轮廓系数、Davies-Bouldin指数等。距离计算。

2024-09-01 10:03:41 1889

原创机器学习西瓜书笔记(八) 第八章集成学习+代码

第八章详细介绍了集成学习，包括了集成学习的概念、原理、常见方法（如Boosting、Bagging、随机森林）、结合策略（如平均法、投票法、学习法）以及多样性的度量和增强。此外，在本章学习时，我还提供了一些Python代码示例，用于展示决策树与Bagging方法的对比，以及使用AdaBoost进行决策树回归的实例。集成学习是一种通过组合多个学习器来解决单一学习器难以解决的复杂问题的方法。它的核心思想是“集思广益”，即通过结合多个学习器的预测结果来提高整体的泛化性能。Boosting。

2024-08-24 09:50:59 1279 1

原创机器学习西瓜书笔记(七) 第七章贝叶斯分类器+代码

第七章详细介绍了贝叶斯分类器及其在机器学习中的应用，包括以下几个主要内容：1. **贝叶斯决策论**：贝叶斯决策论是概率框架下实施决策的基本方法，它考虑如何基于相关概率和误判损失来选择最优的类别标记。贝叶斯最优分类器是基于最小化总体风险的判定准则。2. **极大似然估计**：极大似然估计是一种估计概率模型参数的方法，它通过选择参数值来最大化观测数据出现的似然度。3. **朴素贝叶斯分类器**：朴素贝叶斯分类器是一种简单的概率分类器，它基于属性条件独立性假设。通过计算类先验概率和属性条件概率来进行

2024-08-17 10:04:59 718

原创机器学习西瓜书笔记(六) 第六章支持向量机+代码

支持向量机（Support Vector Machine, SVM）是一种监督学习算法，主要用于分类和回归任务。它基于统计学习理论，特别关注找到数据点之间的最优边界，即最大间隔分割数据，其核心概念和特点如下：

2024-08-12 12:15:26 633

原创机器学习西瓜书笔记(五) 第五章神经网络+代码

神经网络：神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。、神经网络中最基本的成分是神经元(neuron)模型，即上述定义中的"简单单元"。在生物神经网络中，每个神经元与其他神经元相连，当它"兴奋"时，就会向相连的神经元发送化学物质，从而改变这些神经元内的电位；如果某神经元的电位超过了一个"阈值" (threshold)，那么它就会被激活，然后向其他神经元发送化学物质。这一点也被很好的利用在了人工神经网络里。

2024-08-08 12:05:01 1250

原创机器学习西瓜书笔记(四) 第四章决策树+代码

决策树的作用- 决策树通过递归地选择最优属性来构建树状结构，从而对数据进行分类或预测。它通过树的分支来表示决策过程中的不同选择，最终达到叶节点，给出预测结果。决策树的优势- 直观易懂：决策树的结构清晰，易于理解和解释，使得模型的决策过程透明。- 处理混合数据：能够处理包含数值和类别数据的混合数据集。- 无需假设数据分布：与线性回归等方法不同，决策树不需要对数据的分布做出假设。- 灵活性：可以处理非线性关系，通过树的分支结构捕捉复杂的数据模式。决策树的劣势- 过拟合：决策树容易对训练数据过

2024-07-29 19:30:54 1569

原创机器学习西瓜书笔记(三) 第三章线性模型 + 算法代码

线性模型形式简单、易于建模，但却蕴涵着机器学习中一些重要的基本思想许多功能更为强大的非线性模型(nonlinear model)可在线性模型的基础上通过引入层级结构或高维映射而得。

2024-07-21 09:14:53 1066

原创机器学习西瓜书笔记(二)及评估方法和性能度量代码

机器学习西瓜书笔记(二)及评估方法和性能度量代码

2024-07-15 12:19:06 1085

原创机器学习西瓜书笔记(一)

尽管最初设计时并未刻意模仿人脑的生理结构，但后来的神经科学研究发现，SDM中的稀疏编码机制在人脑的视觉、听觉、嗅觉等脑皮层功能中广泛存在。而训练样本集则是对样本空间进行独立采样后获得的子集，一般情况下，训练样本越多，得到的关于该分布的信息就越多，这样就越有可能找到这个函数，也就越有可能通过学习获得具有强泛化能力的模型。深度学习的突破：近年来，深度学习作为机器学习的一个重要分支，取得了巨大的成功。尽管在早期由于计算能力的限制，神经网络的研究进展缓慢，但随着计算能力的提高，神经网络再次成为研究的热点。

2024-07-14 09:39:08 1082

原创计算机视觉CV学习路线

这条学习路线涵盖了从基础理论到实践操作，从传统CV方法到现代深度学习模型的各个方面。通过系统的学习和项目实践，将掌握计算机视觉的关键技术和应用，为未来的深入研究或实际工作打下坚实的基础。

2024-07-12 09:53:23 2085

原创自然语言处理 (NLP) 学习路线

这条学习路线从基础理论到实际操作，从传统NLP到现代深度学习模型，涵盖了学习自然语言处理的各个方面。通过系统的学习和项目实践，将逐步掌握NLP的关键技术和应用，为未来深入研究或实际工作打下坚实基础。

2024-07-11 11:15:46 1047

原创计算机视觉小结

计算机视觉（Computer Vision, CV）是人工智能 (AI) 中最引人注目的领域之一，它让机器能够理解和解释视觉世界。通过捕捉图像和视频，CV 技术可以识别人脸、物体、动作，以及周围的环境。在自动驾驶、安防监控、医疗影像分析等诸多领域，计算机视觉都有着广泛而深入的应用，目前已经成为推动技术进步的重要力量。计算机视觉（CV）是一门研究如何让计算机从数字图像或视频中获得有意义的信息的学科。它从图像处理和信号处理发展而来，结合了计算机科学、数学和工程等多学科知识。

2024-07-10 09:39:54 1249

原创【简介：深度学习大领域应用和需求-腾讯招聘为例】

深度学习常用领域包含：计算机视觉（CV）、自然语言处理（NLP）以及强化学习（RL）等，下面是这些领域的详细应用。图片以腾讯为例，给出了这些领域招聘的要求，可以参考看出各领域的一些求职要求。

2024-07-09 07:51:23 583

原创字节跳动后端开发一面面经

【代码】字节跳动后端开发一面面经。

2024-07-08 10:21:52 1461

原创自然语言处理NLP小结

自然语言处理 (Natural Language Processing, NLP) 是人工智能 (AI) 最热门的领域之一，也被称为人工智能皇冠上的明珠。这要归功于诸如撰写连贯文章的文本生成器、聊天机器人以及产生照片级真实感的文本到图像程序等应用程序。近年来，计算机理解人类语言、编程语言，甚至类似于语言的生物和化学序列（例如 DNA 和蛋白质结构）的能力发生了革命。最新的人工智能模型正在解锁这些领域，以分析输入文本的含义并生成有意义的、富有表现力的输出。

2024-07-07 16:21:19 1143

原创北大代码大模型CodeShell-7B 本地部署记录

本地部署北大大模型codeshell

2023-12-18 11:31:20 2207 5

原创 Python2.7 Django部署在Heroku记录

Python2.7 Django部署在Heroku记录Git+Heroku Cli+Heroku云平台项目自动化部署和发布Git+Heroku Cli+Heroku自动化部署和发布流程：Git+Heroku Cli+Heroku云平台项目自动化部署和发布项目部署在Heroku的云服务器上备注：由于是免费使用的heroku云服务器，所以若运行项目30分钟内没人访问则项目就会被停止，需要重新运行。此外，heroku限制了运行内存和并发访问数量。部署方式特点：使用Git同步本地代码和云平台代码只需配

2021-12-15 10:59:22 729

原创 deepcube部署环境搭建材料记录

anaconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/dm-sonnet: https://pypi.org/project/dm-sonnet/1.10/#filestensorflow-gpu: https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/tensorflow-gpu/生成.condarc配置文件conda config --add channels https

2021-09-21 21:05:11 252

原创学习：遗传算法和 python deap包遗传算法的实现

文章目录一、遗传算法二、deap1.deap功能2.deap例子一个详细的关于deap使用的讲解例子总结参考链接一、遗传算法利用自然界物种遗传的理念，设计的一种最优解搜索算法。遗传算法以一种物种中的所有个体为对象，并利用随机化技术对一个被编码的参数空间进行高效搜索。其中，选择、交叉和变异构成了遗传算法的遗传操作；参数编码、初始群体的设定、适应度函数的设计、遗传操作设计、控制参数设定五个要素组成了遗传算法的核心内容。一个容易理解的遗传算法例子，作者以背包问题讲解遗传算法。简单例子搞懂遗传算法(gene

2021-09-14 10:55:09 4907

原创 (估计器estimator) sklearn中BaseEstimator学习记录

sklearn BaseEstimator记录一、BaseEstimator二、使用步骤1.引入库2.读入数据总结一、BaseEstimator示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下（示例）：import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarn

2021-09-12 23:41:17 4264 1

原创 python inspect 参数检测、官网链接和用途等

python inspect 参数检测等Inspect1.参数查看实例2.Inspect 官网链接和用途Inspect1.参数查看实例代码如下（示例）：# -*- coding: utf-8 -*-"""Created on Sat Sep 11 22:16:25 2021@author: GH"""import numpy as npfrom config.metrics import balanced_accuracy #自定义的评分函数import inspectprint

2021-09-12 22:44:23 352

原创问题与解决：python 字典多行注释失败

问题：python 字典多行注释失败问题描述：在配置config的时候用字典进行存储，为了方便以后阅读打算给字典内的内容添加注释，然后发现多行注释在测试时变成了字典内容，而不是作为注释内容。举个例子:app_config = { ''' annotation: here is the configuration of background ''' 'background':{ 'xxx':'9.1.11', 'yyy':'1.12.1' }}print(app_config)

2021-09-11 23:21:02 1088

原创问题记录：python 模块导入from .xxx import xxx出现No module named ‘main.config‘； ‘main‘ is not a package

python 模块导入from .xxx import xxx出现No module named '__main__.config'; '__main__' is not a package解决：from .xxx import xxx 修正为 from xxx import xxx。理由：相对导入都基于当前模块的名称。由于主模块的名称始终是"main"，因此用作Python应用程序主模块的模块应始终使用绝对导入。...

2021-09-11 22:58:37 1348

原创 VMware Ubuntu16.04 + anaconda安装记录

slef-study-autonomous-vehicle目录数据集- 自动驾驶数据集- 交通标志数据集数据集自动驾驶数据集KITTI数据集数据下载：http://www.cvlibs.net/datasets/kitti/raw_data.phpSemanticKITTI数据集数据下载：http://semantic-kitti.org/dataset.html#download奥迪开源自动驾驶数据集（2020）数据下载：https://www.a2d2.audi/a2d2/e

2021-08-11 23:24:16 682

原创 leetcode：剑指Offer第二版 C++个人笔记分享，Git代码分享

leetcode：剑指Offer第二版 C++个人笔记分享，Git代码分享引言正文后记说明引言之前在刷剑指Offer时，有做一些题解记录和分析，但是其实想起做学习笔记的时候，题已经刷的差不多了。后来，本来打算每天刷题的时候都做一下笔记，但是刷了两天，又被拉去干活了，于是我的学习笔记就断了。没办法，该干活还是得干活，笔记只能往后再找时间补上来。但是做了的题还是得分享一下，于是打算把自己的做题代码分享到Git，然后做一下Git的分享笔记。正文剑指Offer第二版个人做题记录：Git纯享版/其实我就是

2021-07-29 00:28:36 286

原创自动驾驶数据集汇总

自动驾驶数据集汇总：本文总结部分现有自动驾驶数据集，属于我的个人学习资料本文总结部分现有自动驾驶数据集，属于我的个人学习资料本人git，懒狗一枚，学习中会整理一些自动驾驶资料到自动驾驶数据集KITTI数据集SemanticKITTI数据集奥迪开源自动驾驶数据集（2020）福特Multi-AV 数据集（2020）waymo 开源自动驾驶数据集（google 自动驾驶部门）--需要科学上网Nuscenes自动驾驶数据集Apollo 开源自动驾驶数据集（百度）Cityscapes 数据集Lyft 数据集BDD10

2021-07-28 23:42:38 3106 1

原创 C++：剑指Offer第二版48题：最长不含重复字符的子字符串

C++：剑指Offer第二版48题：最长不含重复字符的子字符串原题链接地址题目原文题解：动态规划原题链接地址传送门：https://leetcode-cn.com/problems/zui-chang-bu-han-zhong-fu-zi-fu-de-zi-zi-fu-chuan-lcof/题目原文请从字符串中找出一个最长的不包含重复字符的子字符串，计算该最长子字符串的长度。示例 1:输入: “abcabcbb”输出: 3解释: 因为无重复字符的最长子串是 “abc”，所以其长度为 3。示

2021-07-03 20:42:33 229

原创 C++：剑指Offer第二版47题：礼物的最大价值

C++：剑指Offer第二版47题：礼物的最大价值原题链接地址题目原文题解：动态规划原题链接地址传送门：https://leetcode-cn.com/problems/li-wu-de-zui-da-jie-zhi-lcof/题目原文在一个 m*n 的棋盘的每一格都放有一个礼物，每个礼物都有一定的价值（价值大于 0）。你可以从棋盘的左上角开始拿格子里的礼物，并每次向右或者向下移动一格、直到到达棋盘的右下角。给定一个棋盘及其上面的礼物的价值，请计算你最多能拿到多少价值的礼物？示例 1:输入:[

2021-07-01 18:20:13 224

原创 C++：剑指Offer第二版46题：把数字翻译成字符串

剑指Offer第二版46题：把数字翻译成字符串原题链接地址新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入原题链接地址你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown

2021-06-30 12:29:28 322

原创我的Oracle10G安装（将Oracle装在虚拟机，通过PL/SQL Dev 和 Oracle Client在主机上进行链接）

我的Oracle10G安装（将Oracle装在虚拟机，通过PL/SQL Dev 和 Oracle Client在主机上进行链接）学习记录在虚拟机上装我的XP系统XP下载链接http://www.xitongzhijia.net/xp/201910/165876.htmlCD-Key:QQRXD-DF4V8-XRHH4-XV2BQ-TVMVW将之安装在VMware上将Oracle10G装在XP系统上下载的是Oracle10g：10201_database_win32下载链接：链接：https

2020-05-17 23:23:42 390 1

机器学习西瓜书笔记第五章神经网络及代码.rar

本章主要是关于神经网络算法的详细介绍，包括以下几个核心内容： 1. 神经网络基础 - 定义：神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，能够模拟生物神经系统对真实世界物体的交互反应。 - 神经元模型：基本组成单元，模拟生物神经元的兴奋和传递机制。 2. 神经元的数学模型 - M-P神经元模型：由McCulloch和Pitts于1943年提出，包括输入信号、权重、阀值和激活函数。 - 激活函数：如阶跃函数和Sigmoid函数，用于处理神经元的输出。 3. 感知机与多层网络 - 感知机：由输入层和输出层组成，能够实现基本的逻辑运算。 - 多层网络：包含一个或多个隐层，能够解决非线性可分问题。 4. 误差逆传播算法（BackPropagation, BP） - 目的：训练多层前馈神经网络，通过迭代调整连接权重和神经元的阀值。 - 原理：基于梯度下降策略，利用训练数据的误差来更新网络参数。 5. 其他常见神经网络 - RBF网络：使用径向基函数作为隐层神经元激活函数。 - ART网络：基于竞争型学习的无监督学习策略。 6. 深度学习 - 概念：使用多层隐层的神经网络

2024-08-17

机器学习-西瓜书学习笔记-第四章决策树及代码

本章主要是关于决策树算法的详细介绍，包括以下几个核心内容： 1. 划分选择：决策树学习中，选择最优划分属性是关键。这涉及到如何度量样本集合的纯度，以及如何根据属性划分样本集合。 - 信息熵：信息熵是度量样本集合纯度的一种指标 - 信息增益：使用属性进行划分所获得的纯度提升量 - 属性偏好问题：信息增益对可取值数目较多的属性有偏好 - 增益率：增益率是信息增益与属性的固有值的比值 - 基尼指数：基尼指数反映了从数据集中随机抽取两个样本，其类别标记不一致的概率 2. 剪枝处理：剪枝是决策树学习中对付过拟合的主要手段。包括预剪枝和后剪枝两种策略。 - 预剪枝：在生成决策树的过程中，对每个结点在划分前先进行估计，如果不带来泛化性能提升，则停止划分。 - 后剪枝：先生成一棵完整的决策树，然后自底向上地考察非叶结点，如果替换为叶结点能提升泛化性能，则进行剪枝。 3. 连续与缺失值处理：讨论了在决策树学习中如何处理连续属性和缺失值。连续属性可以通过二分法进行离散化处理。提供了决策树算法的深入理解，包括其关键概念、计算方法以及实际应用

2024-08-13

机器学习西瓜书学习笔记第1-3章，附2/3章算法代码

机器学习西瓜书学习笔记第1-3章，附第二章模型评估与选择/第三章线性模型算法代码。对应的笔记可参考相应博客。深入探讨了经验误差与过拟合等关键概念，旨在为读者提供对机器学习中常见问题的基本理解。随后，本章转向模型评估的领域，系统阐述了评估方法与度量方法。评估方法强调了对数据集的全面利用，而度量方法则聚焦于构建模型评价的量化标准。进一步地，本章介绍了校验方法，这一环节对于确保模型评估结果的准确性与可信度至关重要。最后，本章从理论角度出发，对学习器的性能进行了深入分析，旨在为读者揭示学习器行为背后的原理与机制。一种统计学方法，用于建模和分析两个变量之间的关系：一个因变量和一个或多个自变量。它试图找到自变量和因变量之间的线性关系，这种关系通常用一个方程来表示，这个方程通常被称为线性回归方程。

2024-07-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

机器学习西瓜书笔记第五章神经网络及代码.rar

机器学习-西瓜书学习笔记-第四章决策树及代码

机器学习西瓜书学习笔记第1-3章，附2/3章算法代码

机器学习西瓜书学习笔记第一章和第二章

ARIMA时间序列分析模型

exponential moving average

SSD3-GourmetCoffee

空空如也