强化学习曾小健
"强化学习曾小健2、强化学习曾小健3、我是机器人曾小健具身"都是该号副号。CSDN全站80强博客、总近480w+浏览。AI生成式技术,计算机博士;llama3、Baichuan2、Qwen、GLM-4等等项目贡献人(ArtificialZeng)。这个博客的主题主要是强化学习技术、AI生成式技术、大模型多模态技术、机器人具身智能控制技术、机器/深度学习论文或科研前沿、GNN图神经网络、神经网络,包括人工神经网络和生物神经网络,及其大脑演化,智能和认知的产生,通用人工智能;
展开
-
Qwen2.5-Coder深夜开源炸场,Prompt编程的时代来了!
另外,Qwen2.5-Coder-32B-Instruct 的多编程语言的代码修复能力仍然令人惊喜,这将有助于用户理解和修改自己熟悉的编程语言,极大缓解陌生语言的学习成本。多编程语言:智能的编程助手应该熟悉所有编程语言,Qwen2.5-Coder-32B-Instruct 在 40 多种编程语言上表现出色,在 McEval 上取得了 65.9 的分数,其中 Haskell, Racket 等语言表现令人印象深刻,这得益于在预训练阶段独特的数据清洗和配比。一直相信 Scaling Law 哲学。原创 2024-11-12 16:36:49 · 1083 阅读 · 0 评论 -
最强开源CodeLLM模型深夜来袭!320亿参数,Qwen2.5-Coder新模型超越GPT-4o
闭源模型山头几个月一换,而开源的Qwen却从来没有停下攀登的脚步,也进一步验证,开源模型和闭源模型之间的差距正在缩短,开源模型完全有机会、有能力取代闭源模型,为全球广大开发者用户提供更加低门槛、开放的AI能力。说Qwen2.5-Coder是最受欢迎的开源编程大模型绝不为过,事实上,每一代Qwen编程模型,都代表了开源的最高水平,PK的永远是当时最厉害的闭源模型。今年4月,CodeQwen1.5-7B发布,在基础代码生成能力上,它表现出超过更大尺寸模型的潜力,拉近了开源模型和GPT-4之间的编程能力差距。原创 2024-11-12 16:29:56 · 1208 阅读 · 0 评论 -
[Access]Does ChatGPT Help Novice Programmers WriteBetter Code? Results 全文总结From Static Code Analysis
本文探讨了ChatGPT对初学者程序员编写代码质量的影响。原创 2024-11-03 22:55:42 · 982 阅读 · 0 评论 -
[Access]An Approach for Rapid Source Code DevelopmentBased on ChatGPT and Prompt Engineering
本文提出了一种基于ChatGPT和提示工程(Prompt Engineering)的快速源代码开发方法。原创 2024-11-03 21:55:16 · 648 阅读 · 0 评论 -
[Django代码生成]Learning to Generate Pseudo-Code from Source Code Using Statistical Machine Translation
本文提出了一种使用统计机器翻译(SMT)框架从源代码自动生成伪代码的方法。原创 2024-11-03 19:46:44 · 669 阅读 · 0 评论 -
MarianCG: a code generation transformermodel inspired by machine translation
本文介绍了MarianCG,一种基于Transformer架构的代码生成模型,灵感来源于机器翻译技术。原创 2024-11-03 02:10:00 · 1153 阅读 · 0 评论 -
GitHub Copilot: the perfect Code compLeeter?
这篇论文评估了GitHub Copilot生成的代码质量,基于LeetCode问题集,使用了一个自定义的自动化框架。原创 2024-11-02 17:54:21 · 1140 阅读 · 0 评论 -
代码生成研究脉络
https://paperswithcode.com/sota/code-generation-on-conalaPanGu-Coder-FT-IFine-Tuning Large Language Models for Answering Programming Questions with Code Snippets2023RoBERTaMarianLeveraging pre-trained language models for code generation2023MarianCGMarianCG原创 2024-10-31 18:19:39 · 491 阅读 · 0 评论 -
[小语言模型-代码生成]Textbooks Are All You Need II: phi-1.5 technical report
这篇文章的研究背景是近年来大型语言模型(LLMs)在自然语言处理领域的显著进步,特别是像GPT-4这样的最新一代模型展示了前所未有的能力。然而,这些模型的规模也带来了巨大的经济成本和能源消耗问题。原创 2024-10-30 22:39:31 · 871 阅读 · 0 评论 -
CoNaLa数据集官方:代码/自然语言挑战
CoNaLa:代码/自然语言挑战欢迎来到 CMU CoNaLa 网站,是卡内基梅隆大学和实验室的联合项目!此挑战赛旨在测试从自然语言生成程序片段的系统。例如,如果输入是,则系统需要以 Python 输出。数据集信息我们发布了一个从抓取的数据集,该数据集经过自动筛选,然后由注释者整理,分为 2,379 个训练示例和 500 个测试示例(阅读有关该过程的更多信息)。我们还提供了一个包含 600k 个示例的大型自动挖掘数据集,以及指向其他类似数据集的链接。原创 2024-10-30 22:10:58 · 758 阅读 · 0 评论 -
[自然语言大纲-代码]Natural Language Outlines for Code:Literate Programming in the LLM Era
这篇文章的研究背景是现代大型语言模型(LLMs)如Gemini和GPT-4的进步,使得自动生成软件工件的大纲成为可能。软件开发项目非常复杂,开发者通常花费大量时间理解代码。原创 2024-10-29 17:17:28 · 634 阅读 · 0 评论 -
CodeGeeX: 多语言代码生成模型
与之相反,模型则需要为每种语言分配较大的模型容量来存储相关的知识(一个典型的例子是有着5400亿参数量的PaLMCoder,依靠超大的模型容量取得了惊人的效果),却没有很好抽象出编程语言的高阶知识。对于大规模预训练模型,微调(fine-tuning)的成本是昂贵的,如何使用少量的样本就让模型生成想要的代码,对代码生成模型的实用化具有非常大的意义。)衡量的,具有一定误导性;上述例子中,我们在输入中提供了额外提示----一段逐行解释代码的示例,CodeGeeX加以模仿,将现有的一段代码按照相同的方式进行解释。原创 2024-10-29 15:00:29 · 1100 阅读 · 0 评论 -
我一行代码也没写,Cursor 和 Devbox 给我写了个高仿苹果官网!
Sealos 的操作确实是简单,而且费用也确实是低。如果选择最低配置,一天才几毛钱。从项目开始到上线,总共只需要 1 天时间,其实还是利用空余时间来做的,因为我不是专职码农。这效率放到以前想都不敢想。很多自媒体都在唱 AI 要取代程序员,它这是在取代程序员吗?这分明是在助力程序员啊!害得我恨不得把原来写的哪些屎山代码拿出来重新翻炒一番了。加入 Sealos 开源社区体验像个人电脑一样简单的云操作系统🏠官网链接🐙GitHub 地址📑访问 Sealos 文档🏘️逛逛论坛。原创 2024-10-28 22:04:52 · 1079 阅读 · 0 评论 -
这个代码转文本神器,可以一键将整个仓库喂给AI原创 JJJohn AGI Hunt 2024年10月24日 17:00 北京AI时代,代码也能当小说读!图片你是否曾经想要把整个代码仓库塞
原创 JJJohn2024年10月24日 17:00北京你是否曾经想要把整个代码仓库塞进ChatGPT或Claude的肚子里,让它帮你分析一下代码结构?现在,这个愿望可以轻松实现了!一款名为git2txt的小工具,它能够将整个Git仓库转换为Markdown格式的文本,让你轻松将代码"喂"给各种AI助手。原创 2024-10-26 17:57:57 · 477 阅读 · 0 评论 -
[代码生成-CoNala]Fine-Tuning Large Language Modelsfor Answering Programming Questionswith Code Snippets
这篇论文研究了预训练大型语言模型(LLM)在回答编程相关问题方面的能力,特别是那些主要通过代码片段回答的问题。原创 2024-10-24 21:47:20 · 634 阅读 · 0 评论 -
[代码生成]PANGU-CODER1/2: Program Synthesis withFunction-Level Language Modeling
这篇论文介绍了PANGU-CODER,一种基于PANGU-α架构的预训练解码器语言模型,用于从自然语言问题描述生成编程语言解决方案。原创 2024-10-24 21:42:54 · 753 阅读 · 0 评论 -
讯飞星火数学编程超GPT-4o,联手华为干仗大模型!启动智算平台,助攻小艺声音修复
讯飞星火大模型从发布至今,都在强调基座模型升级与行业应用的紧密结合,目前其已经发布20多个行业大模型,打造了300多个智能体应用,这些形成了可以相互借鉴和复用的规模化效应。如今,以大模型为代表的通用人工智能发展迅猛,今年诺贝尔奖、物理学奖、化学奖都与AI强相关,AI改变科研范式已经成为科技界的共识。以科大讯飞为代表的国内大模型厂商,正在其中扮演着愈加重要的角色。原创 2024-10-24 19:24:52 · 1035 阅读 · 0 评论 -
[sci四区-]ICG: A Machine Learning Benchmark Dataset and Baselines for Inline Code Comment-Java Funcom
这篇论文**《ICG: A Machine Learning Benchmark Dataset and Baselines for Inline Code Comments Generation Task》**探讨了如何构建一个用于内联代码注释生成任务的大规模基准数据集,并提供了几种基线模型。原创 2024-10-24 17:03:24 · 602 阅读 · 0 评论 -
在 LeetCode 数据集上对 Gemma 7B 进行微调:分步指南
Follow跟随阅读时间:4分钟2024 年 9 月 10 日1微调是采用预先训练的模型并使其适应特定任务或数据集的过程。在我们的案例中,我们采用具有广泛知识的 Gemma 模型,并教它解决 LeetCode 上的编码问题。可以把它想象成教一个聪明的学生(我们的预先训练的模型)在特定科目(LeetCode 问题)上表现出色。首先,我们需要收集 LeetCode 问题和解决方案。原创 2024-10-22 17:06:02 · 837 阅读 · 0 评论 -
[代码生成-力扣评估]DeepSeek-Coder: When the Large Language Model MeetsProgramming - The Rise of Code Int长文
这篇论文介绍了DeepSeek-Coder系列,这是一系列开源代码模型,其规模从1.3B到33B不等,通过在2万亿个标记上进行训练而开发。这些模型在多个基准测试中不仅达到了开源代码模型的最先进性能,而且还超越了现有的闭源模型,如Codex和GPT-3.5。此外,DeepSeek-Coder模型在允许研究和商业使用的许可下发布。原创 2024-10-24 11:04:23 · 709 阅读 · 0 评论 -
力扣代码自动评测- Benchmark
下面给出了一种电话键盘上字母到按键的映射作为示例。"x" -> 在按键 2 上按一次 "y" -> 在按键 2 上按两次 "c" -> 在按键 3 上按一次 "d" -> 在按键 3 上按两次 "e" -> 在按键 4 上按一次 "f" -> 在按键 5 上按一次 "g" -> 在按键 6 上按一次 "h" -> 在按键 7 上按一次 "i" -> 在按键 8 上按一次 "j" -> 在按键 9 上按一次 总成本为 1 + 2 + 1 + 2 + 1 + 1 + 1 + 1 + 1 + 1 = 12。原创 2024-10-24 10:55:24 · 529 阅读 · 0 评论 -
[刊ESE-2区-Java]Deep code comment generation with hybrid lexical and syntactical information June 2019
这篇论文提出了一种新的方法,名为Hybrid-DeepCom,用于自动生成Java方法的代码注释。原创 2024-10-24 10:16:37 · 700 阅读 · 0 评论 -
Aider(已升级):Aider利用双模型架构做到85% SOTA得分!(架构师/编辑师助你实现编程新高度)
原创 Aitrainee2024年10月01日 22:02。原创 2024-10-07 03:25:24 · 1132 阅读 · 0 评论 -
[代码注释与解释-CCF-A-ICSE24]Using an LLM to Help With Code Understanding
这篇论文探讨了使用大型语言模型(LLM)在集成开发环境(IDE)中帮助理解代码的潜力。原创 2024-10-23 20:44:17 · 633 阅读 · 0 评论 -
[sci三区-Symmetry代码摘要]A Survey of Automatic Source Code Summarization
这篇论文题为《A Survey of Automatic Source Code Summarization》。原创 2024-10-23 20:30:59 · 694 阅读 · 0 评论 -
[代码注释生成]Deep code comment generation
这篇论文提出了一种名为DeepCom的新方法,用于自动生成Java方法的代码注释。原创 2024-10-23 18:28:08 · 941 阅读 · 0 评论 -
[代码生成-论文翻译]基准数据科学代理
在数据驱动决策的时代,数据分析的复杂性要求具备高级的数据科学专业知识和工具,即使是专家也面临重大挑战。大型语言模型(LLMs)作为有前途的数据科学代理出现,帮助人类进行数据分析和处理。然而,它们的实际效能受到现实世界应用需求多样性和复杂分析过程的限制。本文介绍了DSEval这一新颖的评估范式,以及一系列针对评估这些代理在整个数据科学生命周期中性能的创新基准测试。通过引入一种新颖的自举注释方法,我们简化了数据集准备,提高了评估覆盖率,并扩大了基准测试的全面性。原创 2024-10-23 17:08:13 · 728 阅读 · 0 评论 -
论文解读】用于代码处理的语言模型综述
论文解读】用于代码处理的语言模型综述目录1.简要介绍2.代码处理的语言模型的评估3.通用语言模型4.用于代码处理的特定语言模型5.语言模型的代码特性6.软件开发中的LLM7.结论与挑战1.简要介绍在这项工作中,论文系统地回顾了在代码处理方面的最新进展,包括50个+模型,30个+评估任务和500个相关工作。论文将代码处理模型分解为由GPT家族表示的通用语言模型和专门预训练的代码模型,通常具有定制的目标。原创 2024-10-23 16:35:42 · 536 阅读 · 0 评论 -
[代码评估-指标]CodeBLEU: a Method for Automatic Evaluation of Code Synthesis
这篇论文提出了一种新的代码合成自动评估指标CodeBLEU。原创 2024-10-23 16:30:18 · 1006 阅读 · 0 评论 -
[代码Agent评估]Benchmarking Data Science Agents - 数据集DSEval-LeetCode的提出
这篇论文介绍了一种新的评估数据科学代理的基准测试框架DSEval,并提出了一系列创新的基准测试,用于评估这些代理在整个数据科学生命周期中的性能。原创 2024-10-23 14:51:50 · 1014 阅读 · 0 评论 -
协同机器学习CoML(以前称为 MLCopilot)是面向数据科学家和机器学习开发人员的交互式编码助手,支持大型语言模型。用于数据挖掘和机器学习任务的开箱即用的交互式自然语言编程界 GitHub页面
CoML 配置代理是 MLCopilot 的实现,它可以针对特定任务在特定任务中建议 ML 配置。目前,它是一个独立的组件,位于 中。CoML(以前称为 MLCopilot)是面向数据科学家和机器学习开发人员的交互式编码助手,支持大型语言模型。然后,我们提供了几个命令来帮助您在 Jupyter Lab 中进行交互式编码。命令创建的符号链接。要找到它的位置,您可以运行。然后,您可以删除该文件夹中。未来,我们将把它集成到 CoML 系统中。Jupyter 实验室中的 CoML。在开发模式下,您还需要删除。原创 2024-10-23 14:44:33 · 754 阅读 · 0 评论 -
多图理解,更懂中文,支持function call的Phi-3.5来了!
使用ollama create命令创建自定义模型。原创 2024-10-23 10:07:57 · 100 阅读 · 0 评论 -
参数量最小的大语言模型有哪些
近年来,小参数大语言模型(SLM)逐渐受到关注,尤其是在资源受限的设备上运行的需求日益增长。以下是一些当前参数量较小但性能强大的语言模型。小参数大语言模型因其较低的计算需求和高效的性能,正逐渐成为AI领域的重要选择。微软的Phi系列、Google的Gemma以及Cerebras GPT等模型都展示了在小型化方面的巨大潜力。随着技术的发展,这些模型有望在更多应用场景中发挥作用。原创 2024-10-23 09:55:48 · 689 阅读 · 0 评论 -
AI终于杀死了Leetcode!网友:面试神器已到位
但是,既然OpenAl已经将结构化的 JSON 响应添加到他们的 4-o Mini 中,我会重新考虑使用他们的模型。LeetCode,这个程序员的“试炼场”,如今也迎来了 AI 的挑战。这个脚本在 24 小时内自主完成了 633 道题目,其中包括 217 道简单题、359 道中等题和 57 道困难题,总共花费了 9 美元,成功率达到了 86%。在解题过程中Claude 实际上不断分析了失败的测试结果,并根据测试结果和当前尝试的代码重新尝试解决问题,从而使它能够成功完成问题。用难题拦我了,BAT我来了!原创 2024-10-22 21:07:50 · 447 阅读 · 0 评论 -
Top 20代码生成LLMJul 1, 202332 min readTop 20代码生成LLMNSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/
自动完成或代码生成功能已在开发工具中存在多年。早在1996 年,微软就在 Visual Studio中为 Visual Basic 引入了这一功能(熟悉 Eclipse 的人可能使用过 Java getter 和setter 生成函数,以及变量名的字符串导出函数(著名的“public String toString()”函数)。提供下一行代码仍然是这些 IDE 工具的一个重要功能,通常通过同时按下 Control 和空格键来激活。在可见性范围内,这种语法导向的编辑仍然可以帮助你完成。原创 2024-10-22 21:05:20 · 702 阅读 · 0 评论 -
neulab/conala 代码数据集
在 `strs` 中查找所有出现模式 '\\[[^\\]]*\\]|\\([^\\)]*\\)|"[^"]*"|\\S+' 的字符串。join(a)for a in combinations(['hel','lo','bye'],2)])将字典 `{'class': {'section': 5}}` 添加到字典 `dic` 的键 'Test' 中。构建一个字典,将列表 `[['two', 2], ['one', 1]]` 中的每个列表转换为键/值对作为其项。原创 2024-10-22 16:50:21 · 933 阅读 · 0 评论 -
[sci水刊-ASE]Rethinking AI code generation: a one-shot correction approach based on user feedback
一次性校正自然语言馈的持久性问。原创 2024-10-22 16:23:19 · 775 阅读 · 0 评论 -
[代码评估]Exploring the impact of code review factors on the codereview comment generation为了克服现有数据集的局限性,
这篇论文探讨了代码评审因素对代码评审评论生成的影响。原创 2024-10-22 15:03:21 · 879 阅读 · 0 评论 -
[代码评估-经验研究-会议ICPC]Analyzing Prompt Influence on Automated Method Generation:An Empirical Study
这篇论文题为《Analyzing Prompt Influence on Automated Method Generation: An Empirical Study with Copilot》。原创 2024-10-21 22:32:36 · 611 阅读 · 0 评论 -
20个主流的代码生成LLM大模型及9种常见应用场景
训练混合物包括 20 种不同的语言:Markdown、Java、JavaScript、Python、TypeScript、PHP、SQL、JSX、reStructuredText、Rust、C、CSS、Go、C++、HTML、Vue、Ruby、Jupyter Notebook、R 和 Shell。和文本到文本(文档翻译)。这些系统可能会生成表面上看起来正确的代码,但无法提供预期的服务,要么是因为请求不精确或制定得不好,要么是因为生成的代码由于模型不正确,要么是因为训练代码不正确(垃圾中的垃圾)。原创 2024-10-21 22:23:32 · 176 阅读 · 0 评论