wdloumiga-CSDN博客

原创【无标题】

页面加载时，Vue 启动，随机生成一个 1~100 的答案。你在输入框里打字，inputValue实时更新。每次更新，result计算属性自动重新计算：先把输入转成数字判断是否合法比较大小返回对应的提示文字提示文字立即显示在<p>标签里。

2026-07-02 20:20:37 405

模型形式：y=Xβ+εy=Xβ+ε，其中 ε∼N(0,σ2I)ε∼N(0,σ2I)。最小二乘估计：β^=(XTX)−1XTyβ^=(XTX)−1XTy（要求 XTXXTX 可逆）。决定系数 R2R2：衡量模型对总变异的解释程度。R2=1−SSresSStotR2=1−SStotSSres。取值范围 [0,1]，越接近1拟合越好。均方误差 MSE：1n∑(yi−y^i)2n1∑(yi−y^i)2，衡量预测误差大小。训练集 vs 测试集：若训练集 R2R2 远大于测试集 R2R2，提示过拟合（模

2026-07-01 16:27:07 354

原创《Hadoop生态圈与Hive基础》模拟试卷（卷二）

本文是一份《Hadoop生态圈与Hive基础》模拟试卷（卷二），包含选择题、简答题、编程题和综合应用题。内容涵盖HDFS文件传输单位、Hive表操作、MapReduce流程、YARN架构等核心知识点。试题重点考查：1）HDFS读写流程与元数据管理；2）Hive内外部表区别及分区表操作；3）MapReduce的Shuffle机制；4）Hadoop集群部署与验证方法。综合应用题要求设计Hive分区表进行日志分析，并针对大数据量场景提出分桶、列式存储等优化方案。试卷配有详细解析，适合检测Hadoop和Hive的基

2026-07-01 16:26:37 549

原创大数据技术复习划分知识点

本文摘要： Hadoop技术体系核心知识点梳理，包含五大模块：1）HDFS架构与读写流程，重点解析NameNode、DataNode角色及Shell操作命令；2）MapReduce计算框架核心流程与WordCount案例实现；3）Hive数据仓库的表设计、分区优化及SQL调优技巧；4）Linux环境基础命令与Java异常处理机制；5）高频考点包括集群状态检查、HDFS块大小、核心配置文件及YARN架构组件。全文聚焦分布式系统核心原理与实践操作，适用于大数据开发人员快速掌握关键技术要点。

2026-06-29 08:44:02 326

原创多元统计实验3

密度函数参数：均值向量 μμ（pp 维）、协方差矩阵 ΣΣ（p×pp×p 正定对称矩阵）记号。

2026-06-29 08:42:30 571

原创关联规则与频繁项集

✨ 剪枝的威力就在这：{牛奶,面包,黄油} 明明在 T1、T4 出现了 2 次，但因为 {牛奶,黄油} 不频繁，Apriori 连算都不算它，直接丢弃（当然这里即使算也不够 min_sup，但大数据下剪枝能省海量 IO）。连接：从 L₁ 两两拼 → C₂ = { {牛奶,面包}, {牛奶,黄油}, {面包,黄油} }：对候选 k-项集，检查它的所有 (k-1)-子集是否都在 (k-1)-频繁表里，不在的就删掉。定义的，不是对规则。连接：{牛奶,面包} 和 {面包,黄油} 拼 → {牛奶,面包,黄油}

2026-06-27 11:57:18 432

原创剪枝是什么？

树版本叶子数训练准确率复杂度泛化能力（推测）未剪枝480%高中等（可能过拟合）预剪枝（min_samples_leaf=2）260%低较高（但欠拟合）后剪枝（剪掉节点B）380%中最高（平衡）剪枝属于欠拟合还是过拟合的处理？答：过拟合。剪枝降低复杂度，提高泛化。预剪枝和后剪枝哪个更常用？答：实践中预剪枝更常用（参数简单、速度快），但后剪枝理论上效果更好（CART 默认用 CCP 后剪枝）。剪枝会提高训练准确率吗？。

2026-06-27 11:56:50 754

原创分类与回归的概念分析

回归与分类是监督学习的两种核心范式，本质区别在于输出类型：回归预测连续数值（如房价、温度），分类预测离散类别（如垃圾邮件识别）。回归使用MSE等损失函数，模型包括线性回归、神经网络等；分类采用交叉熵等指标，常用逻辑回归、SVM等模型。需注意逻辑回归虽名含"回归"实为分类方法。两类任务可相互转化（如年龄预测转年龄段分类），实际选择取决于业务需求——需要具体数值选回归，需类别判断选分类。关键判断标准是输出结果为连续值还是离散标签。

2026-06-23 09:12:55 365

原创梯度上升（Gradient Ascent）

梯度上升（Gradient Ascent）就是梯度下降的"镜像版"——。

2026-06-23 09:10:40 491

原创《Hadoop与大数据技术》模拟考试卷

题型选择题理论题程序题综合体分值30分32分24分14分。

2026-06-19 12:01:44 414

原创 Hadoop 与大数据技术考试重点复习提纲

Hadoop与Hive核心考点速览理论考点： Hadoop组件：YARN资源调度；HDFS架构（NameNode元数据管理，DataNode块存储，副本机制）；常用命令（hadoop fs -ls/-put等）；WebUI端口（9870/8088）。 Hive：存储格式（TEXTFILE/ORC/PARQUET）；内/外部表区别（数据生命周期管理）；分区表优化查询。 MapReduce：Shuffle机制（分组排序传输）；输入输出键值对流程。实践考点： HQL编程：建表（指定分隔符/存储格式）、插入数据

2026-06-19 11:59:24 412

原创怎么阻止windows自动更新

做完这个，你再去“Windows 更新”的主页看，那个暂停按钮会变成灰色或者直接显示一个极远的日期，系统基本就放弃对你这台电脑的强推了。，否则哪天你的电脑因为一个没修复的高危漏洞被入侵，或者某些新出的软件（比如新游戏、新办公软件）因为系统太老装不上，那时候就后悔莫及啦！这一层时，右侧的空白区域就会出现很多条目，那时候再进行我们刚才说的“新建 DWORD”的操作。如果你觉得改注册表太麻烦，或者怕改坏了，网上有很多大神制作的免费小工具，专门对付微软的更新。因为你截图里的列表比较长，可能一屏装不下。

2026-06-18 11:46:14 279

原创大数据技术课程总复习知识点

本文总结了Hadoop相关考试的核心内容，涵盖以下四大板块：1. 考试结构：包括选择题（30分）、理论题（32分）、程序题（24分）和综合题（14分）。2. Hadoop理论重点：涉及HDFS命令操作、Hive数据存储格式、Linux权限设置、MapReduce的Shuffle机制、HDFS组件功能（NameNode/DataNode）、YARN端口号及API应用等15个核心知识点。3. Hive与MR流程：强调分区表设计、HDFS读写流程（含Pipeline机制）、MapReduce单词统计案例及集群部署

2026-06-18 10:10:46 569

原创大数据技术——试题

大数据课程期末模拟试卷摘要本试卷包含六个部分，全面考察大数据技术核心知识点：单项选择题（20分）：涵盖Linux命令（rm -r递归删除）、Hadoop配置（伪分布式dfs.replication=1）、YARN组件（ResourceManager）、Hive操作（DESC查看表结构）、文件权限（chmod 600）、Sqoop故障排查（缺少Hive jar包）、Hive分区表（PARTITIONED BY）等基础知识。填空题（10分）：涉及Linux主机名命令（hostname/hostnamect

2026-06-17 07:55:01 344

原创大数据技术——预测题目

本文是一套Hadoop生态系统技术考核试题，包含选择题、填空题、简答题、操作题和综合应用题等多种题型，涵盖Linux命令、Hadoop配置、Hive分区表、Sqoop数据迁移等核心知识点。主要内容包括：Linux系统pwd命令使用、Hadoop伪分布式配置要点、Hive分区表创建与数据加载方法、Sqoop导入MySQL数据到Hive的常见问题解决方案，以及NameNode和DataNode的作用与故障恢复机制。试题重点考查对Hadoop集群配置、数据分区管理和数据迁移工具的实际操作能力，并提供了详细的参考答

2026-06-17 07:54:52 384

原创数据挖掘——复习试题

本文摘要：该文档包含数据挖掘相关的选择题与计算题。选择题涉及数据预处理、分类算法、相似性度量、决策树参数等基础知识；计算题包括朴素贝叶斯分类、关联规则支持度/置信度计算、基尼系数划分、ROC曲线绘制、红酒数据集决策树分析及回归决策树构建。简答题要求对比DBSCAN与K-means算法，并简述抽样与离散化方法。题目综合考察数据挖掘的核心概念、算法应用及数学推导能力。

2026-06-16 12:16:26 190

原创大数据技术——核心知识点复习提纲

按照文档顺序，从 Linux 基础 → JDK → SSH → Hadoop（伪分布 → 集群）→ Hive → Sqoop，边做边记。Hadoop 核心配置文件的含义（core-site, hdfs-site, yarn-site, mapred-site）：熟悉 50070（HDFS）和 8088（YARN）端口的界面，用于查看节点状态和作业运行情况。Hive 中会自动创建表（字段顺序可能与 MySQL 不同，需注意）：配置 MySQL 连接（URL、驱动、用户名、密码）（需 Hadoop 已启动）

2026-06-16 12:16:03 381

原创数据挖掘——复习试题答案解析

本文是一份数据挖掘课程的考试题集，包含选择题和大题两部分。选择题涵盖了数据预处理、数据挖掘目标、相似性度量、频繁项集、分类算法、决策树、Adaboost、DBSCAN等核心概念。大题涉及朴素贝叶斯预测、关联规则计算、决策树构建、基尼系数、信息增益、ROC曲线绘制、回归决策树等实际应用。通过具体案例和计算过程，考查学生对数据挖掘基础理论和算法的掌握程度，包括分类、聚类、关联规则挖掘等关键技术的原理与应用。

2026-06-15 14:01:44 667

原创数据挖掘从零开始：基于实战题目系统性知识复习

本文系统梳理了数据挖掘的核心知识点，主要包括：1）数据预处理（清洗、集成、变换、规约）和特征缩放方法；2）关联规则挖掘中的Apriori算法及其支持度、置信度计算；3）分类算法如决策树（信息增益、基尼指数）和朴素贝叶斯；4）聚类算法（K-Means和DBSCAN的区别）；5）模型评估指标（混淆矩阵、ROC曲线、AUC值）；6）回归树、过拟合/欠拟合处理及集成学习。重点掌握算法原理、计算公式和实际应用场景，特别是决策树构建、关联规则计算和模型评估方法。

2026-06-15 13:53:45 499

原创人工智能实验1——张量操作与自动微分

本文总结了PyTorch的核心知识点：1）张量创建方法（ones/zeros/rand等）；2）广播机制的维度扩展规则；3）自动微分原理（requires_grad、backward、grad属性及梯度累积特性）；4）梯度停止方法（detach/no_grad）。提供了选择题、填空题和简答题等题型，涵盖广播形状判断、梯度计算和代码实现。重点强调梯度下降时需在no_grad()中更新参数并手动清零梯度，避免计算图构建和梯度累积问题。通过函数求导示例和代码填空，强化对PyTorch自动微分机制的理解与应用能力。

2026-06-14 09:31:51 576

原创人工智能实验6——残差网络

本文总结了深度学习中残差网络（ResNet）的核心知识点：1. 残差块通过跳跃连接（H(x)=F(x)+x）解决梯度消失问题，1×1卷积用于维度匹配；2. 批量归一化在卷积后激活前使用，训练测试行为不同；3. 全局平均池化替代全连接层，减少参数量并支持任意输入尺寸。文章详细解析了ResNet-18结构、训练技巧（SGD+余弦退火），并通过对比实验表明残差网络在收敛速度和泛化性能上优于普通网络。最后提供了选择题、填空题、简答题等复习题型，涵盖核心概念理解与代码实现。

2026-06-13 09:59:48 653

原创人工智能实验7—YOLO

摘要：本文总结了目标检测中的关键知识点，包括香蕉数据集格式（D2L/YOLO）、YOLO模型训练配置（预训练权重yolov8n.pt）、评估指标（IoU、mAP系列）及非极大值抑制算法原理。重点对比了迁移学习与微调的效果差异，指出微调能显著提升小数据集检测性能。通过选择题、填空题、简答题和计算题等形式，系统梳理了标签格式转换、NMS实现、过拟合判断等核心内容，并针对实际部署中的多目标漏检问题提出数据增强和NMS调参的解决方案。文中包含IoU计算示例（结果约0.1429）和NMS模拟过程（保留框1、3）。

2026-06-13 09:59:36 331

原创人工智能实验5——卷积神经网络入门

本文总结了卷积神经网络（CNN）的核心知识点与LeNet实现要点。主要内容包括：1）卷积运算基础（卷积核、填充/步幅计算）；2）池化层作用与类型（最大/平均池化）；3）多通道处理与感受野计算；4）LeNet网络架构及MNIST尺寸变化；5）数据增强与设备管理规范。附带典型考题及解析，涵盖选择题、填空题、代码补全和过拟合分析题，重点考察卷积输出尺寸计算（公式：(H_in-K+2P)/S+1）、感受野递推计算（RF=1+(k-1)*s）等核心概念。实验环节强调测试阶段禁用数据增强、正确使用GPU加速等实践要点。

2026-06-12 11:04:50 599

wdloumiga的博客