自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

kaggle expert,全球排名前1000,清华计算机研究生,兴趣算法工程

kaggle expert,全球排名前1000,清华计算机研究生,兴趣算法工程

  • 博客(1400)
  • 资源 (4)
  • 收藏
  • 关注

原创 必知必会!常用矩阵求导和重要的矩阵

转自https://blog.csdn.net/a841454735/article/details/88608682,来备份一下,矩阵求导很重要!一、矩阵求导  一般来讲,我们约定,这是分母布局。常见的矩阵求导方式有:向量对向量求导,标量对向量求导,向量对标量求导。1、向量对向量求导2、标量对向量求导3、向量对标量求导其他的可以参考wiki:维基百科矩阵求导公...

2020-04-25 22:18:20 1919

原创 程序员面试——C++工程师面试大全第一部分

1.static 关键字的作用1. 全局静态变量在全局变量前加上关键字 static,全局变量就定义成一个全局静态变量.静态存储区,在整个程序运行期间一直存在.初始化:未经初始化的全局静态变量会被自动初始化为 0(自动对象的值是任意的,除非他 被显式初始化);作用域:全局静态变量在声明他的文件之外是不可见的,准确地说是从定义之处开始,到文件结尾.2. 局部静态变量在局部...

2020-02-24 13:41:40 702

原创 大模型入门-应用篇4-Deep Research

摘要: Deep Research(深度研究)是AI领域的新范式,通过结合检索探索、结构化分析与报告生成,将零散信息转化为连贯的长篇分析报告。其核心架构分为规划、执行和合成三步骤,利用不同模型优化算力分配。开源框架如ByteDance的DeerFlow(多智能体协同)、LangChainAI的OpenDeep_Research(规划-搜索-反思-撰写)和SkyworkAI的Deep_ResearchAgent(双层架构)展现了多样化实现方案。这一演进标志着AI从信息检索迈向结构化知识生产,为开发者构建高效研

2026-05-14 00:50:46 600

原创 大模型入门-应用篇5-亿级向量的快速检索

在现代的推荐系统或 RAG(检索增强生成)业务中,我们不可避免地需要用到检索。最简单直接的方法是将用户的 Query 向量与数据库中的每一个向量进行遍历对比,这被称为“暴力计算”。这种方法精度最高,但效率极低,且面临着非常严峻的。让我们算一笔账:假设一个向量用 1024 维的float32(4字节)表示,那么单个向量的内存占用就是4Byte×1024。1000w×4Byte×102438GB暴力计算通常只适用于对精度要求极高的场景(例如公安系统的人脸搜索)。

2026-05-14 00:50:28 303

原创 大模型入门-应用篇3-Agent智能体

文章摘要: AI Agent(智能体)是大模型时代的关键技术,其本质是通过大模型代理人类行为,结合规划、记忆和工具使用来完成复杂任务。OpenAI将其定义为"LLM+规划+记忆+工具",复旦大学则提出"大脑-感知-行动"三模块框架。Agent常见工作模式包括反思模式、工具使用模式、ReAct推理行动模式、规划模式和多智能体协同模式。核心功能Function Call允许AI调用预设函数处理现实任务,典型流程为:定义工具函数→描述工具元信息→模型决策调用→执行并生成结果

2026-05-13 22:07:28 227

原创 CodeTop Top 300 热门题目23-回文子串-24-最长重复子串

摘要: 力扣647题要求统计字符串中的回文子串数量。回文子串指正反读相同的连续字符序列。解题方法包括: 中心扩展法:遍历每个可能的中心点(字符或间隙),向两边扩展统计回文数,时间复杂度O(n²)。 动态规划:定义dp[i][j]表示子串s[i:j+1]是否为回文,通过状态转移方程计算,同样为O(n²)复杂度。 示例: "abc" 有3个回文子串("a","b","c")。 "aaa" 有6个("a&

2026-05-13 00:17:57 257

原创 大模型入门-应用篇2-RAG (检索增强生成):从原理到 Python 实战

RAG技术解析:检索增强生成原理与Python实现 摘要:本文深入探讨检索增强生成(RAG)技术,通过结合检索系统与大语言模型解决LLM的知识局限性和幻觉问题。文章首先分析RAG的核心价值:扩展模型知识边界、保障数据隐私、提升回答准确性。随后详细拆解RAG标准流程:文档分块、向量化、向量数据库检索及Prompt组装。通过Python代码示例演示了PDF问答系统的完整实现,包括BM25+Embedding双路召回和融合排序策略。最后指出RAG落地的关键挑战在于知识库构建和检索优化,建议采用专业工具提升工业级应

2026-05-12 00:03:32 602

原创 大模型入门-应用篇1-prompt技术

摘要 本文深入探讨了提升大语言模型交互效果的三大核心技术:思维链(CoT)通过分步推理提高复杂问题解决能力;上下文学习(ICL)利用示例样本增强模型任务理解;以及三种高效提示词编写技巧(CO-STAR框架、分隔符使用和系统提示)。这些方法共同构成了提示工程的核心体系,能显著提升模型输出的准确性、逻辑性和实用性。文章通过具体案例展示了每种技术的应用场景和实施要点,为开发者提供了优化AI交互体验的实用指南。

2026-05-12 00:02:44 612

原创 【python因果库实战33】匹配模型2

本文探讨了匹配方法中卡尺(caliper)对样本匹配效果的影响。通过实验比较了有放回和无放回匹配下不同卡尺阈值对匹配样本比例和平均处理效应(ATE)的影响。结果显示,随着卡尺增大,匹配样本比例提高,但ATE估计趋于稳定。文章还介绍了匹配结果的DataFrame表示方法、权重计算过程,并将匹配方法与逆概率加权(IPW)在协变量平衡方面进行比较。通过可视化展示了不同方法的协变量平衡效果,匹配方法在平衡协变量分布方面表现良好,特别是当结合双向匹配时效果更佳。这些结果为因果推断中选择合适的匹配策略提供了参考。

2026-05-11 00:14:24 308

原创 【python因果库实战32】匹配模型1

本文探讨了使用匹配模型评估吸烟戒断对体重减轻的因果效应。研究采用欧几里得和马哈拉诺比斯距离匹配方法,结果显示两种度量在总体水平上产生相似效果(ATE分别为3.85和3.22)。通过倾向得分匹配,使用逻辑回归模型计算的平均处理效果为2.96-4.68。实验还分析了邻居数量对结果的影响(1-9个邻居时ATE在2.96-3.24之间波动),并比较了有放回和无放回匹配的差异(ATE分别为2.96和3.43)。研究采用数据二值化处理分类变量,避免引入偏差,为因果推断提供了实用方法。

2026-05-11 00:14:09 253

原创 CodeTop Top 300 热门题目21-重复的子字符串-22-删除字符串中的所有相邻重复项

摘要: 力扣459题要求判断字符串是否可由其子串重复构成。提供四种解法:1)字符串拼接法(最优解),通过检查s是否在(s+s)[1:-1]中实现O(n)时间;2)暴力解法,枚举所有可能子串长度并验证,时间复杂度O(n²);3)KMP算法,利用next数组特性判断,时间复杂度O(n);4)详细KMP版本,解释next数组计算过程。测试用例验证了各方法的正确性,其中字符串拼接法最为简洁高效。

2026-05-10 02:01:50 372

原创 【python因果库实战31】LaLonde 数据集匹配2

摘要 本文探讨了使用倾向得分匹配和逆概率加权(IPW)方法处理治疗组与对照组数据不平衡的问题。研究发现,当存在严重的正则性违反时,先进行匹配再应用IPW能更有效地平衡协变量。通过分析匹配样本的协变量差异,发现收入等关键变量的匹配质量较差。实验显示,随着匹配卡尺的调整,治疗效果估计会发生显著变化,甚至出现符号反转。研究还比较了不同匹配策略下的样本利用率,并建议结合匹配与IPW来改善协变量平衡。结果表明,在解决正则性问题后,IPW能提供更稳健的因果效应估计。

2026-05-10 01:59:15 360

原创 【python因果库实战30】LaLonde 数据集匹配1

摘要:本文介绍了LaLonde数据集,该数据集用于评估职业培训项目对参与者就业前景的影响。数据集来自美国国家支持性工作(NSW)项目,包含实验组和对照组的随机分配数据,并补充了未接受培训的对照组数据。数据预处理包括创建收入指示变量(1974和1975年无收入)并提取协变量、处理变量(是否接受培训)和结果变量(1978年收入)。最终数据集包含22,106个样本,其中185人接受了培训。该数据集是因果分析的经典基准,广泛应用于经济学研究。

2026-05-10 01:59:01 184

原创 【python因果库实战29】LaLonde 数据集2

与 Dehejia 和 Wahba 的论文相比,他们在论文中识别出约1700美元的影响(使用 causallib 重现他们的结果可在此处找到),我们只能得出结论,他们使用的对照组并不代表总体人群,并且包含了收入极低的人。通过调整阈值(我们使用的决策树针对基尼指数进行了优化,而不是针对正则性识别,因此我们有权进行调整),我们可以得到更具体的去除。此外,我们只去除了一个真正接受了培训的人。因此,我们定义了一个基于规则的模型,该模型以95.2%的召回率和97%的精确度表征了正则性违规的人群。

2026-05-09 00:03:52 417

原创 【python因果库实战26】逆概率加权模型1

本文介绍了逆概率加权(IPW)模型在因果推断中的应用。通过戒烟对减肥效果影响的数据示例,展示了IPW模型的核心实现步骤:首先使用逻辑回归等机器学习模型估计样本权重,然后基于Horvitz-Thompson估计器计算平均反事实结果,最后评估处理效应。文章详细说明了模型参数设置(如概率截断值、稳定权重选项)和预测阶段的可调参数,并演示了不同效应类型(差值、比率)的估计方法。该模型能够有效控制混杂变量,为观察性研究提供因果效应估计。

2026-05-09 00:03:45 517

原创 【python因果库实战23】异质性效应混合模型 (HEMM) 示例1

本文介绍了异质效应混合模型(HEMM)在治疗效果估计中的应用。HEMM通过假设数据中存在潜在子群,利用有限混合模型来识别异质性治疗效果,提高模型可解释性。研究使用合成数据验证HEMM性能,通过均匀采样生成特征变量X和治疗变量T,并模拟不同子群对治疗的不同响应。实验结果表明,HEMM能有效估计个体治疗效果(ITE),在样本内和样本外均获得较低的精确异质性效应指标(PEHE),验证了其在发现治疗异质性效应方面的能力。该方法为决策者提供了更直观的治疗效果分析工具。

2026-05-08 13:35:48 359

原创 【python因果库实战24】异质性效应混合模型 (HEMM) 示例2

摘要 本文展示了HEMM模型在识别治疗效应增强子群方面的能力。通过get_groups_effect函数提取治疗效应绝对值,确定效果最佳的子群(示例中为子群2)。使用样本内外数据计算ROC曲线下面积(AUC分别为0.974和0.977),验证了模型识别准确性。定性评估通过热图可视化显示HEMM能较好还原真实子群分布。最后通过重抽样实验构建PEHE估计的置信区间,采用不同基础模型(MLP、线性、CF)进行对比分析。实验结果表明HEMM在子群发现和反事实预测方面具有良好性能。

2026-05-08 13:35:24 324

原创 CodeTop Top 300 热门题目19-反转字符串-20-划分字母区间

本文介绍了反转字符串的多种解法,重点推荐双指针法。题目要求原地修改字符数组(空间复杂度O(1)),双指针法通过初始化左右指针,向中间移动并交换字符,时间复杂度O(n)。其他方法包括递归(空间复杂度O(n))、栈(空间复杂度O(n))以及Python特有的切片和reversed()(不满足原地要求)。测试用例验证了各种边界情况,包括空数组、单字符、相同字符等。核心解法简洁高效,体现了算法设计中时间与空间的平衡考量。

2026-05-07 00:28:39 968

原创 CodeTop Top 300 热门题目17-压缩字符串-18-去除重复字母

摘要: LeetCode 443题要求对字符数组进行原地压缩,将连续重复字符替换为字符加计数(计数>1时)。算法使用双指针:一个指针遍历数组统计连续字符个数,另一个指针原地修改数组。时间复杂度O(n),空间复杂度O(1)。示例: 输入["a","a","b","b","c","c","c"]压缩为["a","2",&quot

2026-05-07 00:17:42 370

原创 CodeTop Top 300 热门题目15-第N个数字-16-至少有K个重复字符的最长子串

摘要 该题要求在无限整数序列中找出第n位数字。解题关键在于数学规律分析: 确定位数区间:通过分析不同位数数字所占的位数(1位数字占9位,2位数字占180位等),找到n所在的位数区间。 定位具体数字:在确定位数后,计算n在该区间中的偏移量,从而找到对应的具体数字。 提取目标数字:根据偏移量确定数字中的具体某一位。 算法时间复杂度为O(log n),空间复杂度O(1)。示例显示如何通过数学计算高效定位目标数字,如n=11对应数字10的第2位"0"。该解法避免了暴力拼接,通过数学规律直接定位结

2026-05-07 00:12:34 451

原创 【python因果库实战28】LaLonde 数据集1

文章摘要 LaLonde数据集是经济学中经典的因果分析案例,研究1970年代美国就业培训计划对参与者收入的影响。数据集包含22,106个样本,其中185人接受了培训,包含人口特征、1974-1978年收入等变量。研究者采用倾向评分匹配和反向概率加权(IPW)方法进行分析,结果显示培训计划反而导致参与者收入下降2682美元,这与预期相反。该研究凸显了因果推断中的关键挑战:样本选择偏差、协变量平衡和模型设定问题。数据集至今仍是因果推断方法验证的重要基准,展示了观察性研究中准确估计处理效应的复杂性。

2026-05-06 23:56:40 388

原创 【python因果库实战27】逆概率加权模型2

本文介绍了IPW(逆概率加权)模型的评估方法。首先通过evaluate函数对模型性能进行评估,结果显示预测分数和协变量平衡表。进一步分析包括ROC曲线、PR曲线等可视化图表,用于检验模型效果。特别关注Love图展示的协变量平衡情况,显示加权后处理组和对照组的差异显著减小。文章还探讨了高阶协变量平衡问题,通过引入交互项验证联合分布的平衡性。最后通过ROC曲线分析表明,IP加权后模型在高维空间中也能保持良好的平衡性。评估结果显示该IPW模型能有效平衡协变量分布,为因果推断提供了可靠基础。

2026-05-06 23:56:07 566

原创 【python因果库实战22】快餐业就业数据上比较效应估计量2

摘要 本文探讨了处理因果推断中协变量不平衡的两种方法:IPW(逆概率加权)和倾向得分匹配。IPW通过重新加权样本使处理组和对照组在协变量分布上达到平衡,而匹配方法则通过筛选相似样本构建可比子集。实验表明,IPW能有效改善协变量平衡性,尤其是关键变量EMPTOT;而匹配方法虽然减少了样本量,但显著降低了不平衡性。两种方法均得出轻微正向因果效应的结论,验证了处理效果的一致性。这些技术为观察性研究中的因果推断提供了可靠的解决方案。

2026-04-30 00:13:58 258

原创 【python因果库实战21】快餐业就业数据上比较效应估计量1

摘要 本研究基于卡德和克鲁格关于最低工资对快餐业就业影响的经典研究,使用causallib软件包比较不同因果效应估计方法。分析显示,初始简单估计表明最低工资提高会减少就业,但校正协变量后,实际效应可能为中性或略有增加。研究数据来自新泽西州和宾夕法尼亚州快餐店,包含就业人数、工资等协变量,通过Python实现数据加载和处理,为因果推断提供了标准化分析框架。

2026-04-30 00:13:40 962

原创 CodeTop Top 300 热门题目12-正则表达式匹配

本文介绍了LeetCode上正则表达式匹配问题的两种解法。题目要求实现支持'.'和''的正则匹配,其中'.'匹配任意字符,''匹配零个或多个前驱字符。主要解法是动态规划:定义dp[i][j]表示s前i个字符与p前j个字符是否匹配。状态转移分为两种情况:当p[j-1]是'*'时,考虑匹配0次或多次前驱字符;否则直接比较当前字符。同时提供了递归+记忆化的备选方案,通过缓存中间结果优化性能。两种方法的时间复杂度均为O(mn),适用于处理小规模输入。动态规划解法是面试推荐方案,需重点掌握状态转移方程的设计思路。

2026-04-29 13:35:18 646

原创 CodeTop Top 300 热门题目13-回文数-14-通配符匹配

这篇文章讨论了如何判断一个整数是否为回文数的多种方法。回文数是指正序和倒序读都相同的数字,如121。文章首先介绍了字符串转换法(双指针比较),这是最直观的解法。然后重点讲解了最优解法——反转数字后半部分进行比较,这种方法避免了字符串转换且时间复杂度为O(n)。此外还介绍了反转整个数字的方法(可能溢出)和简洁的一行字符串解法。文章通过多个示例(如1221、121、10等)详细解释了各种方法的执行过程,并给出了时间/空间复杂度分析。对于负数或末尾为0的非零数可直接判定为非回文数。

2026-04-29 13:34:54 569

原创 CodeTop Top 300 热门题目11-验证回文串

验证回文串的四种解法 给定字符串s,判断在过滤非字母数字字符并统一小写后是否为回文。四种解法: 双指针法(最优):左右指针向中间移动,跳过非字母数字字符后比较,时间复杂度O(n),空间O(1)。 预处理法:先过滤非字母数字字符并转小写,再与原字符串反转比较,时间O(n),空间O(n)。 双端队列:用deque存储过滤后的字符,两端同时弹出比较,时间O(n),空间O(n)。 切片反转(最简洁):Pythonic的一行写法,通过列表推导过滤处理后比较反转,时间O(n),空间O(n)。 核心思路都是先处理字符串再

2026-04-28 23:05:35 392

原创 CodeTop Top 300 热门题目10-验证IP地址

摘要: 题目要求验证给定字符串是否为有效的IPv4或IPv6地址。IPv4地址需满足4段数字(0-255),无前导零;IPv6地址需满足8段1-4位的十六进制字符。两种方法实现:1)按协议分隔后分别验证每段规则(推荐,易读);2)使用正则表达式(简洁但难懂)。测试案例包括合法/非法IPv4/IPv6地址,确保边界条件处理正确。核心思路是根据分隔符类型分别验证各段是否符合对应协议的格式要求。

2026-04-28 23:04:13 424

原创 CodeTop Top 300 热门题目9-最长公共前缀

这篇文章介绍了四种解决最长公共前缀问题的方法。纵向扫描法是最直观的解法,通过逐列比较字符实现;横向扫描法采用两两比较策略;分治法通过递归分解问题;排序法则利用字典序特性简化比较。文章对比了各方法的时间复杂度(从O(mn)到O(n log n * m))和适用场景,推荐面试时优先使用纵向扫描法。测试用例覆盖了正常情况、无公共前缀、单字符串和空数组等边界条件,并辅以图解说明算法流程。不同方法适用于不同场景,纵向扫描适合手写代码,分治法适合并行计算需求。

2026-04-27 21:25:21 533

原创 CodeTop Top 300 热门题目8-字符串解码

摘要:LeetCode 394题"字符串解码"要求解码形如k[encoded_string]的嵌套字符串。本文详细介绍了使用栈的解法:遇到数字记录重复次数,遇到'['压栈当前状态,遇到字母追加结果,遇到']'弹栈并合并重复字符串。通过"3[a2[c]]"示例演示了算法流程,最终输出"accaccacc"。该方法时间复杂度O(n),空间复杂度O(n),适用于处理多层嵌套的编码字符串。文章包含完整Python实现、测试用例和复杂度分析,并讨论了数字解析

2026-04-27 21:24:42 571

原创 CodeTop Top 300 热门题目7-翻转字符串里的单词

摘要: 题目要求反转字符串中的单词顺序并处理多余空格。提供两种解法: Pythonic解法:利用split()分割单词,反转列表后用join()拼接,简洁高效。 双指针法:手动处理空格,先整体反转字符串再逐个反转单词,适合考察底层实现(如C++)。 关键点: Python解法推荐方法一,但需说明方法二的双指针思路; 注意处理首尾空格和单词间多空格的情况; 方法二虽模拟原地操作,但Python字符串不可变,实际需额外空间。 示例: 输入" hello world " → 输出"w

2026-04-25 00:09:38 506

原创 CodeTop Top 300 热门题目6-字符串相乘

这篇文章介绍了字符串相乘问题的三种解法。最基础的方法是模拟手工竖式乘法,时间复杂度为O(m*n)。优化版本通过减少中间进位操作次数来提高效率。进阶部分介绍了Karatsuba分治算法,将时间复杂度优化到O(n^1.585)。文章详细讲解了每种方法的实现思路,包括如何处理进位、分割数字以及递归计算乘积。对于超长数字相乘的场景,Karatsuba算法展现出更好的性能优势。代码实现中还包含了大数加减法的辅助函数,以支持Karatsuba算法中的运算需求。

2026-04-25 00:09:21 322

原创 CodeTop Top 300 热门题目5-字符串转换整数 (atoi)

本文介绍了力扣第8题"字符串转换整数(atoi)"的三种解法。第一种常规解法通过逐步处理前导空格、符号位和数字字符,并在累加过程中进行溢出检查,时间复杂度O(n)。第二种正则表达式解法简洁但效率稍低,使用正则匹配数字模式。第三种自动机解法通过状态转移表处理不同输入字符,展示了更系统化的处理流程。三种方法都需特别注意边界条件,如前导空格、正负号、非数字字符和32位整数溢出问题(INT_MAX=2^31-1, INT_MIN=-2^31)。测试用例覆盖了正常情况、边界值和各种异常输入场景。

2026-04-24 00:28:13 362

原创 CodeTop Top 300 热门题目4-比较版本号

摘要:本文介绍了比较版本号的算法实现,题目要求比较由点分隔的修订号组成的版本字符串。提供了两种解决方案:1)分割法(推荐),通过split()分割版本号后逐个比较修订号;2)双指针法(优化版),按需读取修订号避免创建额外数组。两种方法都能正确处理前导零和长度差异,分割法时间复杂度O(m+n),空间复杂度O(m+n);双指针法空间复杂度优化至O(1)。关键点包括用int()自动去前导零、短版本号补0处理以及指针跳过点的注意事项。

2026-04-24 00:27:38 347

原创 CodeTop Top 300 热门题目3-字符串相加

题目要求实现字符串形式的非负整数相加。给定两个字符串num1和num2,模拟手工竖式加法,从最低位开始逐位相加,处理进位。使用双指针从字符串末尾开始遍历,处理长度差异时补0。当前位和为digit1+digit2+carry,结果取模10作为当前位,进位为和整除10。最终反转结果列表得到正确顺序。时间复杂度O(max(m,n)),空间复杂度O(max(m,n))。适用于大数相加,避免直接转换整数导致的溢出问题。

2026-04-23 00:05:34 248

原创 CodeTop Top 300 热门题目2-最长回文子串

本文介绍了寻找字符串中最长回文子串的算法。采用中心扩散法,通过遍历每个字符及其间隙作为中心,向两边扩展寻找回文。时间复杂度为O(n²),空间复杂度O(1)。算法处理了奇偶长度回文的情况,并通过计算起始位置返回最长子串。测试用例验证了算法的正确性,如"babad"返回"bab"或"aba"。关键点在于正确处理单字符和双字符间隙两种中心情况,并准确计算回文起始位置。

2026-04-23 00:05:20 82

原创 CodeTop Top 300 热门题目1-无重复字符的最长子串

摘要: 题目要求找出字符串中最长无重复字符的子串长度。采用滑动窗口+哈希表解法:维护窗口[left,right],用字典记录字符最后出现的位置。遇到重复字符时,将左指针移动到重复字符的下一个位置,确保窗口内无重复。时间复杂度O(n),空间复杂度O(min(m,n))。

2026-04-22 00:29:01 195

原创 CodeTop Top 1000 热门题目(按题型分类)

算法题分类统计与高频题目摘要本文汇总了1000道算法题目,按照20种类型进行分类统计,并列出高频题目:其他类(260道):高频题包括"前K个高频元素"、"圆圈中最后剩下的数字"等动态规划(110道):常见题目如"最长回文子串"、"买卖股票的最佳时机"系列树结构(109道):高频题有"二叉树的层序遍历"、"二叉树的最近公共祖先"等字符串(73道):包括"字符串相加"、"比较版本号"等经典问题数组(71道):高频题如"数组中的第K个最大元素"、"合并两个有序数组"链表(50道):常见题目包括"反

2026-04-22 00:11:50 455

原创 CodeTop Top 300 热门题目(按题型分类)

本文汇总了300道高频算法题目,按题型分类统计。其中树相关题目最多(52道),其次是动态规划(35道)、字符串(33道)和数组(33道)。高频题目包括:二叉树层序遍历(102题)、最大子数组和(53题)、无重复字符的最长子串(3题)等。其他重要题型还包括链表(26道)、数学(19道)、哈希表(16道)等。每道题目均标注难度和出现频度,为算法备考提供重点复习方向。

2026-04-21 23:53:50 321

原创 CodeTop Top 600 热门题目(按题型分类)

文章摘要 本文统计了600道高频算法题目,涵盖21个主要类别。其中树类题目最多(85道),动态规划(73道)和字符串(71道)紧随其后。热门题目包括:二叉树的层序遍历(305次)、最大子数组和(358次)、无重复字符的最长子串(1061次)等。其他重要类别包括数组(66道)、数学(43道)和链表(37道)。数据还显示,哈希表、栈/队列、贪心等类别各有20-30道题目。这份统计为算法学习者提供了重点突破方向,建议优先掌握树、动态规划和字符串三大核心领域的经典题目。

2026-04-21 23:41:29 612

Spark入门.docx

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

2020-04-02

人手一份核武器 - Hacking Team 泄露(开源)资料导览手册 _ WooYun知识库.pdf

事先声明本人并不是全栈安全工程师,仅仅是移动安全小菜一枚,所以对泄漏资料的分析难免会有疏忽或着错误,望各位围观的大侠手下留情。 首先来看安全界两大元老对Hacking Team(以下简称HT)被黑这个事件的看法: @tombkeeper: Stuxnet 让公众知道:“原来真有这种事”,Snowden 让公众知道:“原来这种事这么多”,Hacking Team 让公众知道:“原来这种事都正经当买卖干了”

2020-03-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除