- 博客(15)
- 收藏
- 关注
原创 DAILY LESSON 04大模型基础+Agent
GPT3.0-175B 17.5亿的参数规模-deepseek v3 67.5亿数据120-140亿 12B-14B 出现智能涌现。
2026-05-18 15:44:13
73
原创 学习篇 深度学习 第一章:深度学习基础
传统机器学习算法依赖于人工设计特征并进行特征提取,而深度学习方法则不需要人工参与,而是依靠算法自动提取特征。- 深度学习模仿人脑的运行方式,从经验中学习并获取知识。这也是深度学习被视为“黑盒子”、可解释性差的原因。- **所有深度学习都属于机器学习**,但并非所有机器学习都是深度学习。深度学习的崛起源于其在处理特定类型问题上的能力,尤其是那些传统机器学习算法难以处理的复杂问题。不过,对于某些任务和数据集,更简单的机器学习方法可能更为适合。
2026-05-16 19:40:00
380
原创 机器学习-第七章 朴素贝叶斯+kmeans聚类
朴素贝叶斯是一种分类算法,其核心思想是基于概率进行分类。特征之间相互独立。1.1 什么是朴素贝叶斯贝叶斯:指基于贝叶斯定理,利用概率统计进行分类的方法。它是机器学习中唯一纯粹依赖概率值进行分类的算法。朴素:指“特征条件独立假设”,即假设数据集中每个特征(列)之间是没有关联的,相互独立的。朴素的作用:在这个假设下,计算联合概率或条件概率时,复杂的计算过程可以简化为直接进行概率相乘,从而大大简化了模型的计算复杂度。1.2 概率基础1.2.1 概率:指一件事情发生的可能性,数值在0到1之间。
2026-05-10 17:48:14
357
原创 机器学习-第六章 集成学习
特性Bagging(如随机森林)Boosting(如AdaBoost/GBDT/XGBoost)训练方式并行串行样本采样有放回抽样(子集)全量数据关注点降低方差(防过拟合)降低偏差(提准确率)后续模型任务独立训练修正前序模型的错误典型风险欠拟合可能过拟合可能(如果太关注异常值)算法一句话概括Bagging有放回采样 + 并行训练 + 平权投票Boosting全量数据 + 串行训练 + 加权关注错误样本。
2026-05-07 17:11:33
813
原创 机器学习-第五章 决策树
树中的内部节点表示一个特征上的判断,每个分支代表一个判断结果的输出,每个叶子节点代表一种分类结果信息增益:特征 A 对训练集 D 的信息增益,记作 g(D, A)公式:H(D) :数据集的信息熵(混乱程度)H(D | A) :给定特征 A 下的条件熵大白话:用了特征 A 之后,数据的不确定性减少了多少。信息增益 = 熵 − 条件熵ID3 = 每次找信息增益最大的特征来分裂数据。术语计算对象公式要点熵目标列条件熵特征列分组 + 目标列特征熵特征列本身把特征当目标算熵。
2026-05-06 11:17:12
610
原创 数据科学与机器学习 week8 文本挖掘
文本挖掘已广泛应用于历史、娱乐、安全、执法等领域。随着非结构化文本数据持续增长,AI驱动的文本挖掘将更加关键。伦理问题隐私保护知识产权安全与个人自由的平衡维度数据挖掘文本挖掘输入数据结构化数据(关系数据库、数据仓库)非结构化或半结构化文本(邮件、社交媒体、网页等)数据形式行与列代表明确变量缺乏内在结构,包含自然语言目标发现模式、趋势、关系提取含义、主题、情感核心挑战多义词(词义歧义)上下文依赖句法结构歧义习语表达历史文化背景缺失当前局限。
2026-04-28 23:52:26
575
原创 机器学习-第二章 KNN算法
KNN算法思想:如果一个样本在特征空间中的k个最相似的样本中的大多数属于某一个类别,则该样本也属于这个类别2.k近邻算法样本相似性:样本都是属于一个任务数据集的。样本距离越近则越相似。利用k近邻算法预测电影类型。欧氏距离:对应维度差值平方和,开平方根3.K值选择k值小了,过拟合–数据量少,容易学到脏数据用较小领域中的训练实例进行预测容易受异常点影响k值减小就意味着整体模型变得复杂,容易发生过拟合k值大了,欠拟合–模型变得简单用较大领域中的训练实例进行预测。
2026-04-26 14:45:13
649
原创 机器学习-第一章机器学习概述
本文系统介绍了机器学习的基础知识与发展脉络。首先阐述了人工智能三大概念(AI、ML、DL)的包含关系,重点解析了机器学习的定义、分类(监督/无监督/半监督/强化学习)及三要素(数据、算力、算法)。随后详细讲解了机器学习建模流程(数据获取→处理→特征工程→模型训练→评估),包括特征提取、预处理、降维等关键技术。文中还深入分析了模型拟合问题(欠拟合、过拟合)和泛化能力,并介绍了开发环境搭建方法。通过丰富的图示和案例(如房价预测、西瓜分类),全面展现了机器学习的核心概念、发展历程和实践应用,为初学者构建了完整的知
2026-04-25 15:54:56
406
原创 Jupyter Notebook
shift+enter--执行本单元代码,跳转到下一单元。ctrl+enter--执行本单元代码,留在本单元。环境配置 初识 快捷键 pycharm使用。A--当且cell上面添加cell。B--当前cell下面添加cell。M--切换到Markdown模式。ctrl+鼠标----多光标。1.Anaconda 环境。一 命令模式,按esc进入。Y--切换到code模式。DD--删除当前cell。ctrl+z----回退。ctrl+y----重做。ctrl+/----注释。tab----补全代码。
2026-04-19 15:15:32
40
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅