KE.WINE-CSDN博客

原创每日一题：动态规划

之后可以想办法（如哈希表）去降低时间复杂度，即记忆化搜索或递归树的剪枝，避免对已经计算过的结点再次计算；斐波那契数列的每一项是前两项之和，通常从 0 和 1 开始。既然都有递归了，那肯定有非递归的解法（比如从n=1或n=2进行逆运算）；经典的爬楼梯问题，先从递归想起；扩展：斐波那契数列；

2025-03-18 20:18:44 258

原创 VU~大数据知识点总结

私信获取IT职业道德，云应用等知识点高清图片和其他资料。

2025-02-03 14:25:38 375

原创 HENU~国商计科概率论复习

掌握分布函数的定义、性质及其应用。：了解正态分布的标准化方法，并利用标准正态分布表计算概率。：熟悉指数分布的期望和方差公式及其推导。：掌握离散型随机变量函数的分布计算方法。：理解连续型随机变量概率密度的性质，掌握其分布计算。

2025-02-03 13:44:23 736

求出几个a之间的关系带入到max中，然后分别对a求偏导等于零求出a，如果其中一个a不满足>=0的条件，即将a轮流等于0，找出结果最大的那组a的值，求出w，再利用KKT条件求出b。：在线性可分的情况下，训练数据集的样本点中与分离超平面距离最近的数据点称为支持向量(support vector)将样本从原始空间映射到一个更高维的特征空间, 使得样本在这个特征空间内线性可分.如果样本变多，人工计算不现实，需要一种高效的计算算法。要求最大间隔: 寻找参数 w和 b, 使得。我自己理解的计算方法：先利用。

2025-01-02 19:51:39 297

原创机器学习与数据挖掘：决策树（知识点总结）

决策树叶节点对应于决策结果，内部节点表示一个特征或属性。

2025-01-02 15:11:45 1131

原创机器学习与数据挖掘：聚类（知识点总结）

我们希望“物以类聚”，即同一簇的样本尽可能彼此相似，不同簇的样本尽可能不同。换言之，聚类结果的“簇内相似度”（intra-cluster similarity）高，且“簇间相似度”（inter-cluster similarity）低，这样的聚类效果较好.通常我们是基于某种形式的距离来定义“相似度度量”，距离越大相似度越小，然而，用于相似度度量的距离未必一定要满足距离度量的所有基本性质。通常情况下，密度聚类算法从样本密度的角度来考察样本之间的可连接性，并基于可连接样本不断扩展聚类簇来获得最终的聚类结果。

2024-12-29 17:51:45 502

原创机器学习与数据挖掘：集成学习（知识点总结）

集成学习(ensemblelearning)通过构建并结合多个学习器来完成学习任务，通常可获得比单一学习器更良好的泛化性能。同质（其中的个体学习器被称作基学习器），异质弱学习器：指泛化性能略优于随机猜测的学习器。西瓜书课后习题8.1推导过程（该公式基学习器的误差相互独立）上式显示出，随着集成中个体数量T增大，集成的错误率将指数级下降。个体学习器的“准确性”和“多样性”本身存在冲突当增加多样性会提高准确性，但当多样性增加到一定程度时，准确性会下降。

2024-12-28 19:06:12 1006

原创机器学习与数据挖掘：模型评估与选择（知识点总结）

是一种常用的模型评估方法，用于在有限的数据集上评估模型的性能。k折交叉验证法的优点是能充分利用有限的数据集，减少因数据划分导致的随机性和偶然性，提供对模型性能的更稳定和可靠的评估。Ø交叉验证 t 检验在样本有限的情况下，不同轮次的训练集会有一定程度的重叠，使得测试错误率实际上并不相互独立，会导致估计假设成立的概率过高。Ø学习器的泛化错误率我们无法直接获得，但是我们可以间接的通过学习器的测试错误率来估推出泛化错误率的分布。方差度量了同样大小的训练集的变动所导致的学习性能的变化，即刻画了数据扰动所造成的影响。

2024-12-21 19:01:19 1117

原创机器学习与数据挖掘：神经网络（知识点总结）

神经元接收到来自n个其他神经元传递过来的输入信号，这些输入信号通过。进行传递，神经元接收到的总输入值将与。处理以产生神经元的输出。感知机学习的损失函数。

2024-12-19 23:10:13 250

原创机器学习与数据挖掘：正则化（知识点总结）

假如我们有非常多的特征，我们并不知道其中哪些特征我们要惩罚，我们将对所有的特征进行惩罚，并且让代价函数最优化的软件来选择这些惩罚的程度。1.丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征，或者使用一些模型选择的算法来帮忙（例如 PCA）。保留所有的特征，但是减少参数的大小（magnitude）。

2024-12-04 22:53:25 253

原创机器学习与数据挖掘：逻辑回归（知识点总结）

训练这个逻辑回归分类器：ℎ𝜃 (𝑖) (𝑥)，其中 𝑖 对应每一个可能的 𝑦 = 𝑖，为了做出预测，我们给出输入一个新的 𝑥 值，用这个做预测。我们要做的就是在我们三个分类器里面输入 𝑥，然后我们选择一个让 ℎ𝜃 (𝑖) (𝑥) 最大的𝑖，即max 𝑖 ℎ𝜃 (𝑖) (𝑥)。虽然得到的梯度下降算法表面上看上去与线性回归的梯度下降算法一样，但是这里的ℎ𝜃 (𝑥) = 𝑔(𝜃 𝑇𝑋)与线性回归中不同，所以实际上是不一样的。逻辑回归算法是分类算法，我们将它作为分类

2024-12-04 22:51:57 262

原创机器学习与数据挖掘：线性回归（知识点总结）

梯度下降算法的每次迭代受到学习率的影响，如果学习率𝑎过小，则达到收敛所需的迭代次数会非常高；如果学习率𝑎过大，每次迭代可能不会减小代价函数，可能会越过局部最小值导致无法收敛。对我们之前的线性回归问题运用梯度下降法，关键在于求出代价函数的导数。其中 𝜇𝑛是平均值，𝑠𝑛是标准差。（举例为一元线性模型）

2024-12-04 19:30:58 251

原创每日一题：二分查找中的四种写法

其实这些都可以推出来，用上面的题目推一下，或者像图方便可以取一些特殊值验证一下。

2024-11-28 20:23:17 243

原创每日一题：2080. 区间内查询数字的频率

这组代码其实并不难，花点时间还是可以理解的，但是，我要吐槽的点就来了，这也是我用这道题作例子的原因。因此我们想到，可以用空间换时间的方法，创建一个哈希表用于记录某一个value出现的索引。这题初次作可能有点奇怪，但是熟悉类的一般没啥影响，就是题目会稍微有点难懂些。直接超过时间显示，所以我们要想办法，把时间复杂度减少，也就是把排序去掉。这题，一看都给value，根据固定值查找位置，正是二分查找的典型做法。此处省略一万个调用（尝试展示但网页直接卡死）

2024-11-26 16:37:08 291

原创每日一题：对于二维数组的二分查找

同时也需要想清楚，是increase在requirement中查找还是requirement在increase查找。然而，如果选择第二种，这正和上一步空间换时间重叠。通过看这题，看得C,R,H的数量不断增加，因此可以想到前缀和，用一个容器用来装这个前缀和。然后再让requirements通过二分查找上一步前缀和容器查找能发生剧情的天数，然后放入另一个容器res，最后返回。但是你会发现，这是一个二维数组，一方面如果要求前缀和，就需要两个for嵌套，这样无疑是不符合做题规律的。

2024-11-25 09:51:03 286

原创每日一题：2300. 咒语和药水的成功对数

这一题，对于算法小白，猛一看，就猛一看。然后下一步，点开相关标签一看，原来是二分查找，一想，二分查找我会啊，简单啊，不就是循环取中间值与已知固定值比较查找位置。函数是标准库算法的一部分，它用于在已排序的范围内查找第一个不小于给定值的元素。函数的返回值是一个迭代器，指向在范围内找到的第一个不小于给定值的元素。最后附上一句，11408和C++，奥特曼学完都要亮红灯。之后你通过作另一道类型题，通过看解析发现，可以用。函数，于是你下定决心简化一下代码。最后，还是看了一眼解析，cv解决。于是，你得到了另一托石。

2024-11-23 19:31:02 469

原创机器学习练习 1 - 线性回归

wok，我感觉人家写的太好了，而且恰到好处，现在写八成都是抄的，不划算。机器学习部分先欠着，等我期末复习时候再写。

2024-11-20 22:13:43 190

原创吴恩达机器学习的可选实验室

之后打开电脑的搜索框，搜索Anaconda Prompt，输入jupyter notebooks。有时候会自动打开，有时候需要手动浏览一下发现有可选的链接，按着ctrl点击链接就可以打开。然后打开Anaconda下载jupyter notebooks。在之后输入jupyter notebooks回车。然后选择文件就行了（可以在GitHub上找）

2024-11-20 21:02:27 931

原创每日一题：数组算法中的前缀和问题

该题便是利用前缀和（比如，前2个数的和为pre[1]=pre[0]+nums[1],前4个数的和为pre[3]=pre[2]+nums[3],它们两个详见就是第三个数和第四个数的和）。利用mp容器来记录前缀和，然后遍历nums的同时遍历mp中存在的答案，这样只用了一次for循环（虽然我觉得在查找mp时也增加了一层时间复杂度），时间复杂度大大降低。算法中的前缀和（Prefix Sum）是一种处理数组或序列数据的技术，它通过计算数组中元素的累积和来简化某些问题的处理。方法一：枚举（时间复杂度为。

2024-11-18 22:28:01 484

原创每日一题：数组算法中的位运算

你细想可以很轻松很轻松的发现，不管两边界怎么样，求出的结果总是他们的共同前缀（后面位数&后全为零），但是该前缀和并非严格的前缀，就比如位数不同的情况，所以就需要把二进制位数长的那一个数多出的位数忽略掉。在数组算法中，位运算（bitwise operations）是一种非常高效且强大的工具，特别适用于处理需要快速计算或空间优化的场景。看题便可知该题采用位运算方法解决。

2024-11-12 16:15:21 248

原创每日一题：数组算法中的哈希表

哈希表（Hash Table），也称为散列表，是一种根据关键码值（Key value）而直接进行访问的数据结构。它通过把关键码值映射到表中的一个位置来访问记录，以加快查找的速度。这个映射函数叫做哈希函数（Hash Function），存放记录的数组叫做哈希表。s由英文字母、数字、符号和空格组成，所以变排除vector容器，转用map。目前我所见到的有vector，set和map。

2024-11-11 21:29:56 276

转载每日一题：数组算法中的二分查找

它的工作原理是通过将目标值与数组的中间元素进行比较，根据比较结果决定在数组的哪一半继续搜索，从而缩小搜索范围，直到找到目标值或搜索范围为空。，其中 n 是数组的长度。这使得二分查找在处理大型有序数组时非常高效。二分查找（Binary Search）是一种在。二分查找的时间复杂度为。中查找某一特定元素的。

2024-11-05 16:11:57 69

原创每日一题：数组算法中的回溯问题

回溯算法是一种通过探索所有可能的候选解来找出所有解的算法。通常用于解决组合、排列、子集、图的遍历等问题。在数组算法中，回溯算法的应用尤为广泛，因为它可以有效地生成所有可能的组合或排列。该题便是通过回溯列出所有的可能。

2024-11-02 16:14:34 256

原创每日一题：数组中计算其中三个数的关系

遍历中间值即j，使0<j<n-1,在j遍历到一个位置时，求左边的最大值，以便求（nums[i]-nums[j]）的最大值；求右边的最大值和最小值，当（nums[i]-nums[j]）>0时，左边取最大值，相反求最小值。最后便可以得到在j位置时(nums[i] - nums[j]) * nums[k]的最大值。可以将k遍历，通过k的遍历依次求最大值，最大差值和最大的nums[i]遍历j后用ans保存遍历中求得的最大值。该题是做数组运算中的其中一条解题方法。

2024-11-02 14:33:46 321

原创每日一题：数组算法中的双指针问题

双指针是一种在数组或链表等数据结构中常用的算法技巧。这种方法通常涉及使用两个指针来遍历数据结构，并通过某种方式（如相向而行、同向而行但速度不同等）来解决问题。双指针法可以有效地减少时间复杂度，因为它允许我们同时处理两个元素而不需要使用额外的数据结构。该题可以用暴力解法去求出结果，但时间复杂度就成了。因此可以想到双指针来减少一次幂。

2024-10-30 19:56:02 163

原创每日一题：递归算法

在这一步中，函数会调用自身来解决一个规模更小的相似问题。每次递归调用都应该朝着基准条件的方向前进，即逐渐减小问题的规模，直到达到基准条件为止。递归算法是一种在编程和数学中广泛使用的算法设计技术，它指的是一个函数直接或间接地调用自身来解决子问题的方法。：这是递归调用的终止条件。当满足这个条件时，递归函数将停止调用自身并返回一个结果。基准条件对于防止无限递归至关重要。同样是递归，但是减少了无效的序列保证每次得到的序列是有效（即左右括号数量相等）方法一：暴力（递归）

2024-10-14 11:42:51 258