- 博客(2194)
- 资源 (11)
- 收藏
- 关注
原创 再见Excel!最强国产开源在线表格Luckysheet走红GitHub
Luckysheet具备了大部分Excel中的常用功能,比如文字与单元格的样式调整与公式的使用等。除此之外还提供了独有的复制时转换格式(比如 json 等)以及其他格式的数据导入导出等,可以说Excel具备的常用功能它也都有了。
2020-10-18 16:16:00
6977
1
原创 史上最强gcc4.8安装教程【gcc4.8.2】支持多版本
自动安装包:来源:basicbench包中的basicbench/GCC(by 侯宇)可将上述目录打包放到需要安装的机器上运行自动安装脚本实现安装。手动安装步骤:查看当前gcc版本gcc --version下载依赖包直接安装gcc的话会提示在安装gcc之前,必须安装GMP 4.2以上版本,MPFR2.3.1以上版本, MPC 0.8.0以上版本。cd /tmp wget https://ftp.gnu.org/gnu/gcc/gcc-4.8.2/ tar xvjf g
2020-05-19 19:58:59
6255
原创 搞人工智能的大家都关注了!!
I'M 阿曼,机器学习算法与Python学习【ID:guodongwei2019】公众号的运营小编~作为沟通学习的平台,发布机器学习与数据挖掘、深度学习、Python实战的前沿与动态,欢迎机器学习爱好者的加入,希望帮助你在AI领域更好的发展,期待与你相遇!这里不仅有经典算法的总结,还有大量的学习资料,欢迎关注我们吆添加小助手微信(MLAPython),备注(姓名-单位/学校-研究方向,...
2019-03-12 20:57:19
1227
原创 全网疯传「.SKILL」:只要一句话,就能把任何人蒸馏成 AI,前任、老板、乔布斯。。。
这波SKILL热潮的起点,就是那个戳中无数打工人的「同事.SKILL」——把离职工友的聊天记录、工作习惯喂给AI,就能生成一个一模一样的数字分身,替你接活、查流程、回消息,堪称打工人的摸鱼福音,也藏着几分让人会心一笑的黑色幽默。不用懂代码、不用学复杂操作,只要一个SKILL,就能把任何人蒸馏成专属AI——同事、老板、前任,甚至乔布斯、张一鸣,都能被你炼入token,随叫随到陪你对话、帮你干活,实用性直接拉满!不管是学生党还是职场人,都能用到,学会费曼学习法,轻松拆解复杂问题,高效提升学习、工作效率。
2026-04-09 11:06:54
2017
转载 2026 最新 AI 实战培训:Python 数据分析 + 机器学习 + 深度学习全链路搞定
本课程的最大特色在于:导师全程参与与学员深度互动,课程期间,老师将与每位学员一对一沟通,针对您的研究领域和兴趣,探讨论文选题的可行性与新颖性,帮助梳理研究背景并挖掘创新思路。各科室肿瘤科、神经科、乳腺科、肝胆科、骨科、胃肠外科、血液科、皮肤科、肾内科、免疫科、妇产科、生殖科、外科、神经内科、感染科、儿科、耳鼻喉科、医技科等科研与临床工作人员。已发表多篇高水平的学术研究论文。现在,给你一个玩具展台,“场景、角色、提示词、模型选择、研发目的、科研效果、迭代升级、反思、RAG、辅助工具”,用好每一块儿AI积木,
2026-04-02 08:09:06
243
原创 【龙虾系列】OpenClaw究竟为什么火?用最简单的话讲清楚
它验证了低代码化AI Agent框架的可行性,推动AI从对话交互向自主执行跃迁,但当前仍处于初级阶段,核心机遇在于“自主执行”的技术范式,而非单一产品本身(其发展路径或类似Docker,验证的范式成为行业标配,产品本身可能被大厂吸收优化)。目前已有335个恶意插件混入社区。OpenClaw的爆火,本质是AI从对话交互向自主执行跃迁的行业需求集中爆发,其开源架构与技能生态具备不可忽视的技术价值,但当前安全漏洞、部署门槛、成本问题突出,仍处于实验室向产业化过渡的初级阶段,远未达到全民可用的成熟度。
2026-03-31 17:17:00
766
转载 多模态大模型 Token 压缩技术进展,看这一篇就够了
虽然像 Q-Former 这样的早期 projector 架构通过将大量的视觉嵌入提炼为一组紧凑的查询 Token,实现了高效 Token 压缩,但后续的大量研究为 projector 引入了额外的设计增强,以实现更细粒度和任务自适应的压缩。现有方法根据其是否利用了文本信息(用户指令)可分为纯视觉压缩和文本引导压缩,这两种策略是互补的,一种实用的设计是:首先通过纯视觉压缩导出紧凑的视觉表示,然后在语言模块中应用文本引导的选择机制,以精炼出与给定文本查询相关的 Token。,对现有方法进行了系统性的分类。
2026-03-31 10:31:30
62
原创 73300+Star登顶GitHub!中国开源拿下全球OCR王座!
2025年10月,百度发布开源自研多模态文档解析模型PaddleOCR-VL,仅0.9B参数量,在OmniDocBench V1.5榜单上拿下92.6分综合成绩,超越多款多模态大模型及垂直模型,斩获全球综合性能第一,同时刷新四大核心能力SOTA。AI开源全球赛场,中国力量迎来里程碑突破。此外,PaddleOCR引入蒸馏学习、量化压缩技术,通过大模型蒸馏小模型,在保证精度的前提下,大幅降低模型体积与算力消耗,推出5M至0.9B全系列模型,适配云端、边缘端、终端等不同部署场景,这也是其广泛普及的核心原因。
2026-03-30 19:36:15
397
原创 大厂速报:小红书期权涨麻,字节年终暴击,AI赛道卷疯了
4.1 AI赛道内卷升级:从龙虾智能体引发的全行业竞速,到阿里、京东、字节的技术突破与产品布局,AI已成为大厂必争之地,但同时,工信部专家提示龙虾智能体存在系统级执行权限安全隐患,技术发展与风险管控的平衡,成为行业亟待解决的问题。4.2 精细化运营成趋势:字节年终奖向核心业务、高绩效员工倾斜,小红书聚焦优势品类做电商,美团深耕小众产品打造口碑,大厂已告别野蛮生长,转向精而优的发展模式,跟对公司、选对赛道,成为互联网打工人的核心生存法则。京东酒旅板块迎来关键人事变动,空降邓军担任1号位。
2026-03-26 16:54:42
580
原创 一文读懂大模型,彻底告别 AI 焦虑 | 零门槛
与其抗拒,不如主动接纳,试着用AI解决简单问题——比如用AI写短文、生成图片、整理资料,慢慢熟悉它的功能,你会发现AI其实很简单,能帮你节省大量时间。这串数字不仅代表文字本身,还包含了文字的含义与关联——比如“天气”与“温度”“晴天”“下雨”的数字关联极近,机器通过这种关联,就能理解它们之间的逻辑关系。对于非技术背景的我们来说,不用懂复杂的技术原理,不用害怕自己学不会,只要做到“接纳AI、善用AI、持续学习”,就能在这场AI浪潮中,找到属于自己的位置。它的运作逻辑,就像一个想象力极强的画家、导演。
2026-03-26 08:08:33
708
原创 论文速递|HIPPO:视频大模型推理加速框架,最高提速3.51倍
在多模态AI全面落地的当下,视频大语言模型(Video-LLMs)凭借跨视觉与语言的理解能力,成为视频问答、智能分析、内容生成等场景的核心技术。行业内为缓解算力压力,普遍采用Token剪枝、推理优化等手段,但要么加速效果微乎其微,要么误剪关键语义Token,导致模型理解偏差、输出失真;想实现视频AI实时响应,只能盲目堆高配显卡,落地成本居高不下。:画面边缘的静止背景(墙壁、天空等)因靠近查询位置易被保留,而人物面部、关键动作等核心语义Token反而被剪掉,高剪枝率下模型准确率大幅下滑,属于“盲目减负”。
2026-03-25 19:56:00
581
原创 腾讯 AI 大调整!AI Lab 正式解散,全员并入混元团队
顶尖科研人才的加持,是AI Lab取得诸多突破的关键。作为姚顺雨加盟后主导推出的首个重大版本,混元3.0被视为腾讯AI技术实力的全新展示,而原AI Lab在计算机视觉、多模态、决策等领域的深厚技术积累,将成为混元3.0的重要技术支撑,助力其在多模态交互、复杂场景适配等方面实现全新突破。当前,AI企业不再盲目追求大参数模型,而是聚焦高性价比的端侧模型和垂直领域的「专家模型」,多模态理解、复杂逻辑推理和长程任务执行能力成为核心竞争点,「技术验证」向「产业落地」的跨越,更是所有企业的核心发展目标。
2026-03-21 22:12:36
809
原创 蚂蚁职级大调整,一文看懂大厂职级规则
早在2023年底,蚂蚁就启动了去P化、改用数字职级的改革,而这一轮调整更是直击咱们程序员的痛点——职级拆分更细、晋升流程更简、绩效导向拉满,甚至对基层TL做了M/S双序列拆分,彻底告别了我们吐槽多年的粗颗粒度旧体系。作为程序员,我太懂这种憋屈了:以前不少TL既要管团队又要抓技术,两头顾不上,甚至出现“代码写不明白,管理瞎指挥”的情况,这次拆分后,专业的事归专业人,管理的事归管理者,咱们专心写代码就行,干活顺畅多了。18级及以上:十三薪并入年终奖,强绑定绩效,多劳多得的差距被拉开,干得好回报更可观。
2026-03-20 16:46:00
1154
原创 一文看懂GEO如何给大模型投毒(附最全防范指南)
某头部家电品牌遭遇恶意投毒,多款产品能耗数据在公开平台被系统性篡改,大模型抓取学习后,用户长达半年查询该品牌能耗时,AI均输出错误偏高结果,直接导致品牌销量下滑、口碑受损。:某小众保健品无资质认证,黑产通过GEO工具批量伪造“专家评测”“用户反馈”,AI检索后直接将其列为“养生首选”,多名消费者购买后出现身体不适。:面向大模型、AI检索系统,通过优化内容语义、结构、关键词,让目标信息被AI判定为高可信来源,进而在回答中优先引用、优先推荐。从SEO到GEO,变的是技术手段,不变的是黑产对流量和利益的追逐。
2026-03-20 11:44:00
458
原创 Apt-Serve:基于混合缓存与自适应调度突破LLM推理KV缓存瓶颈,吞吐量提升8.8倍
尤其在长上下文、高突发流量场景中,性能优势更为凸显。论文团队搭建标准化实验环境,基于NVIDIA A100 GPU,选取OPT-13B/30B/66B大模型开展基准测试,与vLLM、Sarathi-Serve、DeepSpeed-FastGen三大主流推理引擎横向对比,实验结果具备充分的严谨性与说服力。Apt-Serve并非孤立优化缓存或调度模块,而是实现二者深度联动:自适应调度依据实时缓存状态制定决策,缓存分配配合调度优先级动态调整,构建“感知-决策-执行”闭环优化体系,实现1+1>2的协同性能增益。
2026-03-20 08:48:57
443
原创 赵世奇二度告别百度:14个月回归梦碎,技术老将的15年江湖路
李彦宏急需一位懂搜索、信得过的老将稳住大局,赵世奇选择回流,出任副总裁、百度搜索总经理,全权负责搜索AI化改造。成绩拔尖的他,2004年保送读研,2006年开启硕博连读,多年深耕NLP领域,练就了扎实的学术功底和技术思维,为职场爆发铺好了路。2020年,百度陷入转型瓶颈,赵世奇做出意外选择——离开深耕十年的老东家,加盟华为出任终端云服务搜索与地图BU总裁,职级升至华为T22。PC时代,百度是当之无愧的互联网入口;它折射的,是百度在传统搜索失速、AI浪潮碾压下,躲不开的战略阵痛,更是不得不做的组织换血。
2026-03-19 17:17:00
789
原创 2026互联网大厂梯队最新排名!
58同城(本地信息枢纽)、贝壳(房产交易龙头)、360(网络安全壁垒)、金山办公(办公软件垄断)、商汤科技(AI视觉领先)、Keep(健身垂类龙头)、美图(影像工具独家)、夸克/UC(差异化搜索工具)B站(Z世代内容壁垒)、爱奇艺/腾讯视频/优酷/芒果TV(长视频版权壁垒)、喜马拉雅(音频龙头)、知乎(知识问答独家)、微博(舆论社交核心)、咪咕(体育版权优势)、虎扑(男性垂类高粘性)得物(潮品电商垄断)、唯品会(特卖赛道龙头)、苏宁易购(家电线上线下融合)、当当网(图书电商老牌)、蘑菇街(服饰垂类深耕)
2026-03-19 10:56:10
4232
原创 SWAN-GPT:无需长文本训练,也能驾驭超长文本
SWAN-GPT提出了一种新的解码器-仅Transformer架构,该架构能够在不需要额外长上下文训练的情况下,稳健地泛化到比训练期间看到的序列长度显著更长的序列。纯NoPE模型的短板十分明显,虽能自主学习隐式位置信息,但超出训练长度后就会完全失效。的文本,就会出现性能断崖式下跌,甚至直接无法正常推理,位置编码紊乱、注意力计算爆炸等问题频发,成为长文本AI商业化落地的核心拦路虎。这种双层交替设计,既摆脱了传统固定长度窗口的限制,又有效规避了纯NoPE模型易出现的位置紊乱问题,实现1+1>2的协同增效效果。
2026-03-19 08:19:00
454
原创 近期大厂内部爆料合集:高管换帅、职级洗牌、下班提前,还有这些冷知识太好嗑
值得一提的是,前端岗位职能、员工title、职级均无变动,仅调整协作模式和汇报线,不折腾员工、只聚焦业务提效。据内部信源透露,美团近期管理层沟通会上,王兴明确要求内部禁止称呼其“兴哥”,推行全员直呼其名,将江湖气昵称归类为需规避的风格,主打平等职业化的沟通氛围,这个流传近十年的昵称,正式退出美团内部语境。拼多多晋升调薪机制堪称大厂清流,不熬资历只看实力:晋升窗口一年两次(3月、9月),调薪周期半年一次,只要绩效达标、产出亮眼,晋升涨薪速度远超行业平均,不用苦熬年限,适合想拼成长、攒收入的打工人。
2026-03-18 16:29:54
1125
转载 8000 万美元!AI 大牛刘威带队,Video Rebirth 拿下 AMD、现代汽车战略投资,剑指工业级 AI 视频基建
由前腾讯杰出科学家、IEEE Fellow 刘威博士创立的Video Rebirth,正式宣布完成8000 万美元新一轮融资,由 AMD Ventures、现代汽车联合领投,Openspace Capital 等顶尖机构跟投,泰合资本担任本轮独家财务顾问。与市面上多数追求 “快出片” 的 AI 视频工具不同,Video Rebirth 坚持从物理规律底层重构视频生成,核心解决行业长期痛点:画面跳变、物体扭曲、物理逻辑混乱。发表顶级会议 / 期刊论文280+ 篇,被引4.5 万 +,h-index 103。
2026-03-18 14:17:02
197
原创 Transformer-XL:突破固定长度枷锁,重构长文本语言模型
本文深度解读Transformer-XL核心架构,拆解段级递归与相对位置编码两大创新,彻底解决传统Transformer上下文碎片化、长依赖建模失效难题,兼顾性能与效率,是长文本AI的奠基性工作。Transformer-XL没有推翻Transformer架构,而是做了两项关键改进,既保留自注意力优势,又彻底突破长度限制,同时解决效率痛点。可以说,没有Transformer-XL,就没有如今主流大模型的长上下文能力,它是现代长文本AI不可或缺的奠基之作。你在长文本建模、模型部署中遇到过哪些长度瓶颈?
2026-03-18 10:39:00
429
原创 【收藏级】Skill、提示词、MCP、Agent 分不清?一篇讲透不绕弯
举个更形象的类比,帮你彻底分清: 把Agent比作“厨师”,提示词是“客户点的菜(比如番茄炒蛋)”,Skill是“厨师的切菜、炒菜、装盘技能”,MCP是“厨师的大脑(负责统筹先切菜、后炒菜,把控火候和味道)”——厨师(Agent)根据客户的点单(提示词),调动自己的技能(Skill),在大脑(MCP)的指挥下,做出一道符合要求的番茄炒蛋(完成任务)。提示词可临时修改,Skill可重复调用(比如封装一次“邮件发送Skill”,后续所有需要发邮件的任务都能直接调用,无需重复编写)。
2026-03-18 08:12:02
2052
转载 硬核爆款|DeepSeek、GPT、Qwen 全架构图合集,Karpathy 狂赞的宝藏画廊!
这里汇集了大量近年来出现的主流模型,包括 Llama、DeepSeek、Gemma、Mistral、Qwen、Kimi、GLM等多个系列,参数规模从几亿参数的小模型,一直延伸到千亿乃至万亿级模型。叫得上名字的几乎数都数不过来:从 GPT、Llama、Gemma、Mistral,到 DeepSeek、Qwen、Kimi、GLM、MiniMax 等等,新模型几乎以周更的速度出现。如果把过去几年主流模型的架构放在一起,你会发现一个明显的空白:我们拥有大量模型,却缺少一张清晰的大模型架构图。
2026-03-17 19:59:19
74
转载 太强了!真心建议所有高校教师与研究生及工程师学者不要错过这个,必须要学一下!!
我们将深入探讨DeepSeek模型的架构、优势以及在科研中的实际应用,帮助学员掌握如何利用这一先进工具提升科研效率,我们的课程还包含数据分析,机器学习,深度学习项目实战:使用AI大模型结合Python(Anaconda、Jupyter)完成从数据清洗、特征工程到模型训练(线性回归、LightGBM、LSTM、CNN等)的全流程脚本生成与可视化,辅以AI自动绘图(散点图、ROC曲线、特征重要性图等),自动建模,自动分析结论等功能。然而,繁重的科研任务和有限的指导资源让许多人在论文写作过程中感到迷茫。
2025-12-23 22:13:01
137
转载 什么?Kimi推理架构宣布:开!源!了! Github标星1.7K
量子位 | 公众号 QbitAI什么?Kimi底层推理架构刚刚宣布:开!源!了!你没听错,就是那个承载了Kimi线上80%以上流量的架构。昨天,月之暗面Kimi联合清华大学等机构,开源了大模型推理架构Mooncake。根据官方介绍,本次开源将采用分阶段的方式:逐步开源高性能KVCache多级缓存Mooncake Store的实现,同时针对各类推理引擎和底层存储/传输资源进行兼容。其中传输引擎Tr...
2024-11-29 21:14:36
595
转载 <span class=“js_title_inner“>什么?Kimi推理架构宣布:开!源!了! Github标星1.7K</span>
具体而言,Mooncake采用以KVCache为中心的解耦架构,将预填充集群与解码集群分离,并充分利用GPU集群中未充分利用的CPU、DRAM和SSD资源,实现KVCache的解耦缓存。据悉,Mooncake开源项目从论文延伸,以超大规模KVCache缓存池为中心,通过以存换算的创新理念大幅度减少算力开销,显著提升了推理吞吐量。简单说,其核心思想是在请求实际开始处理之前,根据当前系统的负载情况预测是否有足够的资源来处理新的请求。通常来说,这种预测会基于当前的请求模式、系统的资源使用情况以及历史数据等信息。
2024-11-29 21:14:36
109
转载 Python3.8退役在即,你准备好了吗?
https://pythonspeed.com/articles/stop-using-python-3.8发布将在3.8 发布5 年后停止。也就是说,2024 年10月是Python 3.8 版本发布的最后一个月,从2024 年10月开始,如果存在安全错误,Python 开发团队将不会修复该错误。截至 2024 年 9 月,从 PyPI 下载的软件包中约有 14% 适用于 Python 3...
2024-11-19 14:49:49
863
转载 <span class=“js_title_inner“>Python3.8退役在即,你准备好了吗?</span>
当然,长期支持仅在有限的时间内持续,例如,Ubuntu 20.04(包含 Python 3.8 的版本)将于 2025 年 4 月结束常规安全更新,之后,将能够获得个人使用的安全更新,但对于大规模商业用途,就需要向 Ubuntu 付费。在短期内,最低目标是切换到维护可用依赖项版本的Python版本,例如,如果你依赖 Pandas,正如我们所看到的,上一个兼容 3.9 的版本是在 2023 年 6 月,所以你至少要使用 Python 3.9。浙大 TableGPT2 开源,横扫任务榜,最强表格 AI问世!
2024-11-19 14:49:49
88
转载 Python数据库大揭秘:7款不为人知的宝藏工具
作者:钱魏Way来源:https://www.biaodianfu.com/python-databases.htmlPython 作为一种高层次的编程语言,因其简单易用和强大的社区支持,被用于实现多种类型的数据库。这些数据库可以分为几大类,包括关系型数据库、NoSQL 数据库、嵌入式数据库和面向对象数据库等。下面这些数据库不常用,看可以通过学习这些项目源码提升自己对数据库的理解。PickleDB...
2024-11-15 11:20:00
507
转载 面了一个字节50k大佬,见识到了基础天花板!
接offer了:最近有个老同学进了宇宙厂,拿了50K×16薪!马上找他要来了几套高质量最新大厂AI面试题和项目实战。既是高频真题,也是一套AI进阶学习宝典。几乎满足各级AI工程师的需求。据说有不少朋友靠这套资料成功入职了阿里、腾讯、京东等大厂。掌握了不单能应付面试,还能学到更多的AI核心知识,应用在工作中!之前私圈分享过的面试真题,反馈都还不错,今天公开分享一波。公开分享:整套资料涵盖:机器学习M...
2024-11-14 10:10:37
237
转载 AutoGPT太火了,GitHub 16.8万星!
机器之心报道OpenAI 的 Andrej Karpathy 都大力宣传,认为 AutoGPT 是 prompt 工程的下一个前沿。最近一个名为 AutoGPT 的研究开始走进大众视野。项目一经上线,短短几天狂揽 168k + 星,这也侧面验证了项目的火爆。GitHub 地址:https://github.com/torantulino/auto-gpt问题来了,AutoGPT 到底是什么?它是一...
2024-11-12 20:54:05
310
转载 何恺明在MIT的第二门课,大神授课,干货满满!
大神:何恺明,MIT,编辑:机器之心又有机会跟着大神学习了!今年 2 月起,何恺明已经开始了自己在 MIT 的副教授职业生涯,并在 3 月 7 日走上讲台完成了「人生中教的第一堂课」。近日,我们发现了何恺明的第二门课程《深度生成模型》(6.S978: Deep Generative Models),已经于 9 月初开始了授课。课程地址????:https://mit-6s978.github.io/在何...
2024-11-11 16:04:19
251
转载 <span class=“js_title_inner“>何恺明在MIT的第二门课,大神授课,干货满满!</span>
课程介绍了深度生成模型的概念、原理和应用,主要涵盖了计算机视觉(如图像、视频、几何)和相关领域(如机器人技术、生物学、材料科学等)中的场景。课程共分为 15 周完成,除了第 1 周和最后一周,每周各有两节课(分别为阅读课和讲座)。更详细的课程计划参考下图,接下来的主题将包括:视频、3D、几何、机器人、材料科学、蛋白质和生物学等领域的应用。包括变分自编码器、自回归模型、生成对抗网络、扩散模型及其应用,覆盖了基础框架和最新研究前沿。Week 4:自回归(AR)模型、AR 和分词器(tokenizer)
2024-11-11 16:04:19
53
转载 浙大 TableGPT2 开源,横扫任务榜,最强表格 AI问世!
机器之心报道当结构化数据也变成一个模态,哪家的大语言模型能脱颖而出呢?现在正是多模态大模型的时代,图像、视频、音频、3D、甚至气象运动都在纷纷与大型语言模型的原生文本模态组合。而浙江大学及其计算机创新技术研究院的一个数十人团队也将结构化数据(包括数据库、数仓、表格、json 等)视为了一种独立模态。基于这一视角,依托 Qwen,他们研发了 TableGPT 系列模型。现如今,这个模型已经更新到了...
2024-11-08 09:55:51
548
1
转载 <span class=“js_title_inner“>浙大 TableGPT2 开源,横扫任务榜,最强表格 AI问世!</span>
具体来说,80% 的 CPT 数据都是标注良好的代码,从而确保 TableGPT2 具有稳健的编程能力,这与 DeepSeek-v2 采用的方法是一致的。为了克服这一局限性,团队构建了这个更具挑战性、更能反映实际应用场景的新基准,从商业智能(BI)场景中的真实表格中收集了 360 个复杂数据表格,并在此基础上制定了 6000 个真实、复杂的查询语句。最后,执行评估,这会用到一个包含约 94.9K 个案例(包括现有案例和新构建的案例)的固定验证集,如此可确保生成的结果是可执行且准确的。
2024-11-08 09:55:51
46
转载 揭秘Pluggy,快速实现插件化系统!
链接:https://pyloong.github.io/pythonic-project-guidelines/guidelines/advanced/plugin/plug-in 在维基百科中是这么定义的:“在计算中,插件是软件组件,为现有计算机程序增加一个特定的特征。” 所以插件应该是一个能够灵活配置,并很方便的载入配置中的内容。由于 Python 本身的动态特性,插件化的实现就更灵活。现有...
2024-11-07 10:05:16
338
转载 50K*16薪,进字节了!
前言: 上周找字节的面试官朋友(职级3-1)要来了几套高质量AI项目实战内部资料。既是热点项目,也是一套AI进阶学习宝典,无论是就业还是科研实验都需要项目实战和源码支撑。据说有不少朋友靠这套资料成功入职了腾讯、京东、美团等大厂。掌握了不单能用于科研学习,还能学到更多的AI核心知识,应用在工作中!之前私圈分享过的热点项目实战,反馈都还不错,今天公开分享一波。内部资料: 整套资料内容囊括:机器学习、...
2024-11-06 10:10:30
174
转载 一文看懂LLM推理,UCL重磅解读OpenAI ο1的相关方法
机器之心报道OpenAI 最近发布的 o1 系列模型堪称迈向强人工智能的一次飞跃,其强大的推理能力为我们描绘出了下一代人工智能模型的未来图景。近日,伦敦大学学院(UCL)人工智能中心汪军教授撰写了一份「LLM 推理教程」,深入详细地介绍了 OpenAI ο1 模型背后的相关方法。链接:https://github.com/openreasoner/openr/blob/main/reports/T...
2024-10-21 21:37:06
343
转载 Mamba 来袭!Transformer 最强竞争者!
来源:机器之心本文介绍了 Mamba 这一颇具潜力的新架构。它是结构化的状态空间序列模型,可高效捕获序列数据依赖关系,其建模能力比肩 Transformer 且具线性可扩展性。文中还阐述了其原理、相关技术及应用,同时也提及了它面临的挑战与机遇。深度学习架构有很多,但近些年最成功的莫过于 Transformer,其已经在多个应用领域确立了自己的主导地位。如此成功的一大关键推动力是注意力机制,这能让基...
2024-10-08 21:41:33
339
转载 独家解读:OpenAI o1开启「后训练」时代强化学习新范式
转自机器之心新的扩展律Post-Training已经出现,后训练的时代已经到来。OpenAI o1 在数学、代码、长程规划等问题取得显著的进步。一部分业内人士分析其原因是由于构建足够庞大的逻辑数据集 <问题,明确的正确答案> ,再加上类似 AlphaGo 中 MCTS 和 RL 的方法直接搜索,只要提供足够的计算量用于搜索,总可以搜到最后的正确路径。然而,这样只是建立起问题和答案之间的...
2024-09-20 14:49:12
976
神经网络分析.pptx
2020-09-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅