AI 学习
文章平均质量分 90
AI 知识介绍与学习笔记
科技之歌
银行总行高级系统架构师、智能交互实验室负责人,中国通信学会会员。主持和参与 10 余项国家级相关项目及企业相关项目,获得发明专利授权 6项,专注于LLM应用、自然语言处理与元宇宙交互等领域, 在智能交互与人工智能产业化落地方面有着丰富经验。
展开
-
leetcode 552. 学生出勤记录 II
如果第 i 天的出勤记录是 ‘L’,则前 i 天和前 i−1 天的出勤记录相比,‘A’ 的数量不变,结尾连续 ‘L’ 的数量加 1,此时要求前 i−1 天的出勤记录记录中的结尾连续 ‘L’ 的数量不超过 1,否则前 i 天的出勤记录的结尾至少有 3 个 ‘L’,不满足可奖励的条件,因此对 0≤j≤1 和 1≤k≤2,有。定义 dp[i][j][k] 表示前 i 天有 j 个 ‘A’ 且结尾有连续 k 个 ‘L’ 的可奖励的出勤记录的数量,其中 0≤i≤n,0≤j≤1,0≤k≤2。空间复杂度:O(1)。原创 2024-08-19 17:12:47 · 869 阅读 · 0 评论 -
leetcode 2940: 找到 Alice 和 Bob 可以相遇的建筑
第二个查询中,Alice 和 Bob 可以移动到建筑 5 ,因为 heights[0] < heights[5] 且 heights[3] < heights[5]。第四个查询中,Alice 和 Bob 可以移动到建筑 5 ,因为 heights[3] < heights[5] 且 heights[4] < heights[5]。第二个查询中,Alice 和 Bob 可以移动到建筑 6 ,因为 heights[3] < heights[6] 且 heights[5] < heights[6]。原创 2024-08-10 08:35:49 · 635 阅读 · 0 评论 -
Prefix Tuning论文解读
为了解决这些问题,研究人员提出了一种新的方法——Prefix Tuning,它通过优化连续的提示(prompts)来适应不同的生成任务,而无需修改预训练模型的主要参数。Prefix Tuning的核心思想是在预训练模型的输入层之前添加一系列可训练的连续向量(即前缀),这些前缀作为额外的输入与原始输入一起被模型处理。为了克服这些问题,Prefix Tuning提出了一种新的思路:通过向预训练模型添加可训练的连续提示(prompts),而不是直接修改模型的主要参数,来实现对新任务的适应。原创 2024-08-08 17:47:34 · 470 阅读 · 0 评论 -
Adapter Tuning:高效NLP迁移学习方法
论文在多个数据集上验证了Adapter Tuning的有效性,主要包括GLUE基准测试集和其他17个公开的文本分类任务。这些数据集涵盖了广泛的NLP任务,如情感分析、文本蕴含、问答等,确保了实验结果的全面性和代表性。GLUE基准测试集:包含多个文本分类和文本对任务,如MNLI(多类型自然语言推理)、QNLI(问题自然语言推理)、QQP(问答对匹配)等。这些任务旨在评估模型在理解自然语言文本及其关系方面的能力。其他文本分类任务。原创 2024-08-08 11:18:15 · 1002 阅读 · 0 评论 -
提示工程方法总结
高效提示方法的发展经历了从手动设计提示到自动优化提示的转变,未来的提示方法可能会将高效提示范式抽象为一个多目标优化问题,旨在压缩提示以降低计算复杂性,同时优化LLM任务的准确性。可以预见,未来的提示研究将围绕硬提示展开,因为LLM的不可访问性已成为不可逆转的趋势。未来的研究方向可能包括:过滤掉冗余信息、微调LLM的可访问参数、以及硬提示和软提示的协同优化。论文链接。原创 2024-08-06 18:08:19 · 1130 阅读 · 0 评论 -
新增道路查询后的最短距离
今天看到很有意思的一个题目,记录下来,供大家参考。原创 2024-08-04 21:57:53 · 424 阅读 · 0 评论 -
从信息论的角度看微博推荐算法
香农在其开创性著作《通信的数学理论》中首次提出了信息论。信息论的核心在于量化信息的不确定性和相关性。熵(Entropy)是衡量信息不确定性的度量,互信息(Mutual Information)则衡量两个信息源之间的相互依赖性,而信道容量(Channel Capacity)则描述了在特定信道下可以传输的最大信息量。通过本文的探讨,我们可以看到信息论在推荐系统中的广泛应用和重要性。从信息论的基础概念到其在推荐系统中的具体应用,再到微博推荐算法的全链路信息论实践,信息论为推荐系统提供了一种新的视角和方法。原创 2024-07-25 08:44:07 · 1212 阅读 · 0 评论 -
Leetcode 2972. 统计移除递增子数组的数目 II
题目描述:给你一个下标从开始的整数数组nums。如果nums的一个子数组满足:移除这个子数组后剩余元素,那么我们称这个子数组为子数组。比方说,中的[3, 4]是一个移除递增子数组,因为移除该子数组后,变为[5, 6, 7],是严格递增的。请你返回nums中子数组的总数目。,剩余元素为空的数组也视为是递增的。指的是一个数组中一段连续的元素序列。10。原创 2024-07-11 08:29:38 · 402 阅读 · 0 评论 -
Leetcode 115 不同的子序列
在实际应用中,推荐使用动态规划或递归加记忆化的方法来解决这类问题,因为它们具有更高的效率。动态规划方法通过填表的方式避免了重复计算,而递归加记忆化方法则通过记忆化来优化递归过程中的重复计算,两者都是解决这类问题的有效手段。原创 2024-07-04 17:29:42 · 486 阅读 · 0 评论 -
数字人智能对话系统
本文介绍了一种在人工智能时代带来的新型人机交互范式——数字人智能对话系统。通过整合自动语音识别(ASR)、大型语言模型(LLM)、文本到语音转换(TTS)、语音克隆(Voice Clone)以及数字人生成(TFG)等多项技术。我们探讨了各个技术模块的功能和实现方式,展示了如何通过高效的音视频流式服务来实现实时、自然的人机对话。随着人工智能技术的不断发展,数字人智能对话系统将迎来更加广阔的发展前景,如以下几个方面:🔸随着大型语言模型的不断进步和优化,数字人智能对话系统将能够实现更加智能、自然的对话体验。原创 2024-07-03 08:49:05 · 873 阅读 · 0 评论 -
OpenSearch的演进与语义检索技术革新
OpenSearch是一个开源的搜索与分析套件,起源于ElasticSearch 7.10.2版本,坚持Apache-2.0开源协议,以开源优先和社区驱动为原则。OpenSearch项目不仅提供了强大的搜索功能,还包括了DataPrepper、Dashboard等组件,广泛应用于搜索、可观测性、安全分析、数据可视化和机器学习等领域。向量搜索引擎从原始向量做写入、查询,OpenSearch做了很多运行速度、压缩量化方面的优化。原创 2024-07-02 10:04:52 · 893 阅读 · 0 评论 -
目标检测算法的研究现状
一阶段检测器如YOLO(You Only Look Once)和SSD(Single Shot MultiBox Detector)等,通过直接在图像上设置大量的预定义锚框(anchor boxes),并预测其类别和位置,实现快速的目标检测。Faster R-CNN的损失函数包括RPN的分类损失、RPN的边界框回归损失、Fast R-CNN的分类损失和Fast R-CNN的边界框回归损失。多模态大模型在目标检测领域的应用日益广泛,它们通过结合文本、图像等多种模态的信息,提高了目标检测的准确性和效率。原创 2024-07-01 09:26:57 · 805 阅读 · 0 评论 -
LLM在软件测试中的革新应用
LLM在软件测试领域的应用具有广泛的前景和潜力。通过构建领域知识库和业务知识图谱、自动生成测试用例和测试数据、实现测试自动化和智能化、进行缺陷预测和挖掘以及实现代码精准测试等应用方向,LLM可以大大提高软件测试的效率和质量,为软件质量保障提供有力支持。然而,我们也需要注意到LLM在软件测试领域的应用还存在一些挑战和问题。例如,如何保证LLM模型的准确性和鲁棒性、如何处理多语言和跨文化的问题、如何平衡LLM模型的学习效率和效果等。原创 2024-06-27 09:48:29 · 1016 阅读 · 0 评论 -
LeetCode 2732. 找到矩阵中的好子集
给定一个 m x n 的整数矩阵mat和一个整数k,我们需要找到一个大小为k的子集rows,使得这个子集对应的行在矩阵mat中构成的子矩阵中,所有元素之和最大。返回这个子矩阵中所有元素之和的最大值。rowsrowsk18解释:选择第 1 行和第 2 行,得到子矩阵,子矩阵中所有元素之和为 18。为了解决这个问题,我们需要从几个不同的角度进行思考。首先,由于题目要求返回的是子矩阵中所有元素之和的最大值,我们可以考虑使用贪心算法来尝试解决这个问题。原创 2024-06-25 22:02:00 · 781 阅读 · 0 评论 -
IPython使用技巧整理
在IPython中,可以使用%alias命令为常用命令创建别名,以便更快地执行它们。例如,可以将%history命令的别名设置为hh # 执行%history命令,列出历史命令列表此外,还可以使用%macro命令将一系列命令组合成一个宏,并为该宏命名。然后,可以通过宏名来执行这组命令。在需要重复执行一系列命令时非常有用。# 定义一个宏,用于绘制正弦波plt.show()# 执行宏,绘制正弦波sine_plot。原创 2024-06-25 09:00:26 · 593 阅读 · 0 评论 -
决策树算法介绍:原理与案例实现
后剪枝是在决策树生成完成后进行的剪枝,它首先将决策树生长到最大,然后自底向上对非叶子节点进行考察,若将该节点对应的子树替换为叶子节点能带来性能提升,则将该子树替换为叶子节点。我们将使用scikit-learn内置的Iris数据集,这是一个经典的多分类问题数据集,包含了三种鸢尾花的四个特征(花萼长度、花萼宽度、花瓣长度、花瓣宽度)和对应的类别标签。预剪枝是在决策树生成过程中进行的剪枝,当某个节点的划分不能带来性能提升时,就停止该节点的划分,并将其标记为叶子节点。常见的决策树剪枝技术包括预剪枝和后剪枝。原创 2024-06-19 08:39:39 · 1106 阅读 · 0 评论 -
联盟学习:技术原理、特点及适用场景
联盟学习作为一种新兴的技术,为数据价值的挖掘提供了新的思路和方法。通过深入学习和实践联盟学习技术,我们可以更好地利用碎片化、分散化的数据资源,推动科技进步和社会发展。同时,我们也需要关注联盟学习的不足之处和潜在风险,加强安全防护和性能优化等方面的研究。原创 2024-06-24 07:15:00 · 902 阅读 · 0 评论 -
LLM开源框架总结
Rank1、AutoGPT(161k stars)>https://github.com/Significant-Gravitas/AutoGPTRank2、LangChain(82.7k stars)>https://github.com/langchain-ai/langchainRank3、MetaGPT(39.1k stars)>https://github.com/geekan/MetaGPTRank4、AutoGen(24.8k stars)>https://github.com/microso原创 2024-06-23 07:15:00 · 368 阅读 · 0 评论 -
VXML Grammars, Scope, and Event Handlers
构建健壮的语音应用程序意味着在有经验的用户和小白用户的需求之间取得平衡。有经验的用户通常希望跳转到他们已经知道的选项;小白用户通常希望他们能得到相应的帮助。与大多数现代编程语言一样,Voice XML提供了一个结构化的应用程序框架,它支持事件、处理程序和范围规则,使开发人员能够微调语音应用程序在不同上下文中的响应方式。 了解VXML基础知识(如dtmf、field...原创 2020-04-01 14:52:02 · 370 阅读 · 0 评论