自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(527)
  • 收藏
  • 关注

原创 彻底火了!《AIGC 面试宝典》圈粉无数!

2022 年下半年以来,文本生成图像快速出圈,多款应用持续火爆。国外文生图代表:Midjourney、Stable Diffusion、OpenAI 的 DALL-E:海外模型SD开源,进一步促进了国内大厂的研究热情和应用落地:随着多模态技术迭代,图像生成、视频生成、3D生成、音频生成等 AIGC 应用加速落地,相关岗位需求特别旺盛。节前,我们星球群组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、最近参加社招和校招面试的同学。

2024-05-20 23:17:28 1901

原创 《机器学习算法面试宝典》重磅发布!

我们经常会组织场算法岗技术&面试讨论会,会邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。基于讨论和经验总结,历时半年的梳理和修改,《机器学习算法面试宝典》(以下简称《算法面试宝典》)终于可以跟大家见面了。

2024-05-05 22:38:03 1085

原创 重磅来袭!《大模型面试宝典》(2024版) 发布!

2022 年11月底,OpenAI 正式推出 ChatGPT ,不到两个月的时间,月活用户就突破1亿,成为史上增长最快的消费者应用。目前国内已发布的大模型超过200个,大模型的出现彻底改变了我们的生活和学习方式。现在只要你想从事 AI 相关的岗位,无论是计算机视觉(CV)、自然语言处理(NLP)、搜广推、风控等,大模型相关话题都是绕不开的。节前,我们星球群组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、最近参加社招和校招面试的同学。

2024-03-23 10:06:20 1844

原创 重磅来袭!《大模型实战宝典》(2024版) 发布!

2024 年刚开年,OpenAI 推出的文生视频工具 Sora 再次风靡全球,成为 OpenAI 继 ChatGPT 之后新的生成式 AI 标杆。关于大模型的话题不断涌现,令人应接不暇,截至到目前,国内大模型已发布数量超过200个。去年我们写了一本《大模型实战宝典》(以下简称《实战宝典》),有很多小伙伴订阅,反馈内容通俗易懂,有基础知识做铺垫,收获了很多。今年年初开始,就开始计划内容大版本升级,前期也做了很多准备工作。

2024-03-23 10:04:23 964

原创 比 PyTorch 的官方文档还香啊,吃透PyTorch中文版来了

PyTorch 作为学生以及研究人员首选的热门框架之一,拥有易用性等优势。具备简约性、通用性的资料才是好资料。如果说 PyTorch 的官方文档的掌握难度是5级,那它的难度大概为2级,难度虽然低了,但知识点一个却没有少。教程里有什么?教程根据官方提供的文档,尽量完整的进行了还原。包括简单的PyTorch建模流程,核心概念,层次结构,低、中、高阶API等等。部分内容如下,建模数据准备:模型范例:低阶API示范:可视化人工绘图:教程目录上下滑动即可查看完整目录▼一、Pytorch的建

2022-01-04 21:48:33 3722 3

原创 我最喜欢的10个顶级数据科学资源,kaggle、TDS、arXiv......

当我声明数据科学正在成为最受欢迎的工作领域之一时,我想你不会与我争辩,特别是考虑到《哈佛商业评论》将 "数据科学家 "评为21世纪最性感的工作。在这个领域,我们已经走过了很长的路,从数据科学和机器学习等术语还不为人所知,到一切都聚集在统计学的保护伞下的时代。然而,我们还远远没有走到终点。这也可能是数据科学的一个分界点——这个领域发展得非常迅速,甚至很难跟上所有新的算法、技术和方法。因此,在数据科学领域工作,与软件工程类似,

2021-12-17 16:08:34 849

原创 画出漂亮的神经网络图,神经网络可视化工具大汇总

分享几款画神经网络图神器,喜欢欢迎点赞、关注、收藏。1. draw_convnet一个用于画卷积神经网络的Python脚本https://github.com/gwding/draw_convnet2. NNSVGhttp://alexlenail.me/NN-SVG/LeNet.html3. PlotNeuralNethttps://github.com/HarisIqbal88/PlotNeuralNet使用latex 来展示神经网络4. Tensorboardhttps:

2021-12-16 20:05:34 3065

原创 PyCaret时序模块更新:支持30+时序模型

PyCaret是一个开源、低代码的Python机器学习库,可自动执行机器学习工作流。它是一种端到端的机器学习和模型管理工具,可以以指数方式加快实验周期并提高您的工作效率。与其他开源机器学习库相比,PyCaret是一个替代的低代码库,可用于仅用几行代码替换数百行代码。这使得实验速度和效率呈指数级增长。PyCaret本质上是围绕多个机器学习库和框架(例如 scikit-learn、XGBoost、LightGBM、CatBoost、spaCy、Optuna、Hyperopt、Ray 等的Python包装器。

2021-12-15 22:41:13 1554 3

原创 何恺明一作论文 MAE 已有人复现(Pytorch版)

何恺明大佬新作一发出来,知乎上就有众多大佬在讨论除了大家对何恺明大佬的工作的肯定外(当然部分认为novelty不足),也引发对未来CV工作的思考,是否会引领类似去年 transformer那样子的热潮?亦或是证明ViT的各种改变可能都是没有意义的。这次何恺明大佬又把握了技术发展的趋势,NLP和CV互相融合的工作看来会是大势所趋。论文链接:https://arxiv.org/pdf/2111.06377.pdf复现代码:https://github.com/pengzhiliang/MAE-py

2021-12-01 10:16:58 1850 1

原创 何恺明MAE大火之后,想梳理下视觉Transformer?这篇综述帮你梳理了100多个

在这篇论文中,Yang Liu 等几位研究者全面回顾了用于三个基本 CV 任务(分类、检测和分割)的 100 多个视觉 Transfomer。这段时间,计算机视觉圈有点热闹。先是何恺明等人用简单的掩蔽自编码器MAE证明了 Transformer 扩展到 CV 大模型的光明前景;紧接着,字节跳动又推出了部分指标超过 MAE 的新方法iBOT,将十几项视觉任务的 SOTA 又往前推了一步。这些进展给该领域的研究者带来了很大的鼓舞。在这样一个节点,我们有必要梳理一下 CV 领域 Transformer 模.

2021-11-26 13:06:21 928

原创 还在纠结CNN还是Transformer?清华发表一篇survey:全连接层才是终极答案

随着神经网络的发展,各种各样的模型都被研究出来,卷积、Transformer也是计算机视觉中国常用的模型,而最近清华大学发表了一篇survey,研究结果或许表明全连接层才是最适合视觉的模型,并将迎来新的AI范式转换!多层感知机(MLP)或全连接(FC)网络是历史上第一个神经网络结构,由多层线性层和非线性激活叠加而成,但受到当时硬件计算能力和数据集大小的限制,这颗明珠被埋没了数十年。这场人工智能变革也带来了一次AI范式的转换,从手工抽取特征到CNN自动抽取局部特征,基于深度学习的计算机视觉的就是利用多层

2021-11-24 14:22:40 2688

原创 可定制算法和环境,这个开源强化学习框架火了

强化学习框架怎么选?不如自己定制一个。强化学习(reinforcement learning,RL)是近年来最受关注的人工智能研究方向之一,在机器人、游戏等领域应用甚广。现有的强化学习框架往往无法支持高效、定制化的训练场景的问题。近日,GitHub 上一个名为 JORLDY 的开源、可定制强化学习(RL)框架引发关注。项目地址:https://github.com/kakaoenterprise/JORLDYJORLDY 的主要优点是提供多种分布式强化学习算法,并且易于定制。由于 JORLDY 目

2021-11-20 15:09:43 3802

原创 一文彻底搞懂如何评估大模型 - 基准测试(Benchmark)

最近这一两周不少互联网公司都已经开始秋招提前批面试了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。如何评估大模型是面试常问的问题,今天我总结一下:LLM(Large Language Model,大型语言模型)中的Benchmark(基准测试)是用于衡量和比较不同LLM性能的一组经过精心设计的测试任务、问题和数据集。

2024-10-02 11:54:04 479

原创 大模型实战项目 | 5分钟利用 OpenVINO 部署 Qwen2.5

Qwen2.5 是阿里通义团队近期最新发布的文本生成系列模型,基于更富的语料数据集训练,相较于 Qwen2,Qwen2.5 获得了显著更多的知识(MMLU:85+),并在编程能力(HumanEval 85+)和数学能力(MATH 80+)方面有了大幅提升。此外,GenAI API 提供了 chat 模式的构建方法,通过声明 pipe.start_chat()以及pipe.finish_chat(),多轮聊天中的历史数据将被以 kvcache 的形态,在内存中进行管理,从而提升运行效率。

2024-10-02 11:47:22 346

原创 面了智谱大模型算法岗,效率贼高!

总体上智谱AI效率比较高,问的内容偏向于实践,节奏和互联网大厂这边一致,拿到机会,比较开心。

2024-10-01 21:56:28 229

原创 基于 QAnything 的知识库问答系统:技术解析与应用实践

QAnything 是一个基于 AI 技术的本地知识库问答系统,它允许用户将各种格式的文档(如 PDF、Word、图片等)导入到本地知识库中,然后通过自然语言对话的方式与这些文档进行交互。这种方式极大地简化了信息检索和知识管理的过程,使得用户可以更加便捷地获取所需信息。企业知识管理:帮助企业整合内部文档,提高员工获取信息的效率。个人学习助手:辅助学生或研究人员快速检索和理解大量学习资料。客户服务:为客服人员提供快速准确的信息检索工具,提高服务质量。法律和合规:协助法律专业人士快速查找相关法规和案例。

2024-10-01 21:45:49 967

原创 用ChatGPT做数据分析与挖掘,爽啊

最近已有不少大厂都在秋招宣讲了,也有一些在 Offer 发放阶段。节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。在现代数据分析中,Python凭借其强大的数据处理能力和丰富的库资源成为首选工具。ChatGPT,作为先进的自然语言处理模型,正逐步成为Python数据分析与挖掘的强大辅助工具。

2024-09-29 09:18:48 1091

原创 阿里算法岗面试,一上来就手撕代码。。。

最近已有不少大厂都在秋招宣讲了,也有一些在 Offer 发放阶段。节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。今天分享我们一位星球成员面试淘天集团算法岗面经:最近面了淘天集团算法岗,面试官很 Nice,技术细节问的很细,上来就是手撕代码,对我来说还是第一次遇到。

2024-09-29 09:10:17 620

原创 行业落地分享:大模型 RAG 难点与创新应用

最近这一两周不少互联网公司都已经开始秋招面试了不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。与常规的系统化内容分享不同,我们今天将聚焦于那些在实践中发现的难点和创新应用。我们相信,这些真实的案例和经验,能够给大家带来不同角度的思考和启发。

2024-09-21 17:19:16 706

原创 面了美团大模型算法岗,已拒 Offer

最近这一两周不少互联网公司都已经开始秋招面试了不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。今天分享我们一星球成员的美团大模型面经:背景:北京985本硕,4篇顶会‍‍‍‍两面结束,二面面试官说虽然优秀,但不能够入选人才计划。

2024-09-21 17:13:50 504

原创 面试字节视觉大模型算法岗,太难了。。。

最近这一两周看到不少互联网公司都已经开始秋招提前批面试了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。今年是大模型场景落地爆发的一年,各大厂商都在将大模型与自身业务相结合。最近我们星球一成员吐槽字节视觉大模型算法工程师,太难了。。

2024-09-01 15:39:21 1251

原创 一文彻底搞懂大模型 - LLM的构建流程

最近这一两周看到不少互联网公司都已经开始秋招提前批面试了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。大模型(LLM,Large Language Model)的构建流程,特别是OpenAI所使用的大语言模型GPT构建流程,主要包含四个阶段:预训练、有监督微调、奖励建模和强化学习。

2024-09-01 15:36:47 1010

原创 行业落地分享:阿里云搜索RAG应用实践

生成的答案应基于可靠的数据源,减少错误信息的产生。

2024-08-29 17:38:06 1304

原创 行业落地分享:阿里1688 大模型 Agent应用实践

在这种模式下,AI作为一个嵌入式工具,辅助人类完成特定任务。

2024-08-29 17:36:21 790

原创 小白学大模型:GLM 调用教程

最近这一两周看到不少互联网公司都已经开始秋招提前批面试了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。

2024-08-19 22:51:51 1064

原创 面了美团大模型算法岗,问的贼细。。。

最近这一两周看到不少互联网公司都已经开始秋招提前批面试了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。

2024-08-19 22:47:55 892

原创 国内真正意义上的OpenAI,最强多模态大模型 MiniCPM-V 2.6 发布

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。大家好,今天继续分享几个开源项目!

2024-08-11 08:13:34 1054

原创 大模型高级RAG技术全面解析(附代码)

在检索步骤中,用户的查询也被转换为嵌入,此嵌入用于在向量数据库中搜索最相关的文本数据。最后,在生成步骤中,查询会使用先前检索到的相关文档进行增强,大型语言模型会使用此增强的提示来生成对用户问题的答案。下一步,它使用 Faiss 执行向量搜索,Faiss 返回前五个最接近的文档的索引,这些索引用于根据文档的排名创建反向分数文档(即,最接近的文档得分最高)。上面提供的伪代码概述了使用机器学习根据相关性对文档进行重新排序的方法,具体来说,是通过预测用户根据过去的交互找到相关文档的可能性。

2024-08-11 07:56:44 1072

原创 如何将大模型的上下文扩展至百万级

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。在2023年初,即便是当时最先进的GPT-3.5,其上下文长度也仅限于2k。然而,时至今日,1M的上下文长度已经成为衡量模型技术先进性的重要标志之一。如果把 LLM 比作新时代的操作系统,上下文窗口便是它的「内存」。

2024-08-10 21:52:42 1040

原创 大厂上来就手撕 Transformer,心凉了一半。。。

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。我们星球一球友跟我微信聊天,说最近去一家大厂面试,上来就手撕 Transformer,费了九牛二虎之力,心情凉一半。。。这两年,特别是大模型出来后,关于 Transformer 的面试题很多,也特别新。

2024-08-10 21:48:14 874

原创 一文彻底搞懂 Fine-tuning - 超参数(Hyperparameter)

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。

2024-08-04 00:22:50 1053

原创 一文彻底搞懂Fine-tuning - 预训练和微调(Pre-training vs Fine-tuning)

这种方式更加关注于模型参数层面的调整,根据是否调整全部参数,可以细分为全面微调(Full Fine-tuning)和部分/参数高效微调(Parameter-Efficient Fine-tuning, PEFT)。

2024-08-04 00:18:07 1169

原创 面完腾讯算法岗,心态崩了。。。

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。最近分享了很多大厂的算法岗面试真题(校招提前批已经开始了),大家要清楚:AIGC相关的面试题猛增,特别是爆火的LLM、多模态、扩散模型等考察的知识点越来越多。这里特别整理了一些腾讯最新算法岗面试中的代表性面试题,下图中的题目,你会几题?!如何压缩3DGS?

2024-07-28 23:15:47 615

原创 Meta 发布 Llama3.1,一站教你如何推理、微调、部署大模型

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。

2024-07-28 23:03:46 2012

原创 Meta 发布地表最大、最强大模型 Llama 3.1

Llama 3.1 405B 是第一个在通用知识、操控性、数学、工具使用和多语言翻译等方面达到当前先进水平的 AI 模型。随着 405B 模型的发布,我们将全力推动创新,带来前所未有的增长和探索机会。我们相信,新一代拉玛将引发新的应用和建模范式,包括合成数据生成,以帮助改进和训练较小的模型,以及模型蒸馏——这是在开源领域从未实现过的能力。在此次最新版本中,我们推出了升级版的8B和70B模型。这些模型支持多种语言,上下文长度大幅提升至128K,具备最先进的工具使用能力和整体更强的推理能力。

2024-07-28 22:51:16 736

原创 不愧是快手,这 AIGC 算法面试题有点难度

最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。

2024-07-20 09:46:18 828

原创 关于垂直领域大模型的探索和尝试

以上就是我们团队这段时间在垂类大模型的一些思考和实践。经过一年多的探索,虽然我们在不少的场景上都有突破和进展,但肉眼可见依然有很多领域尚未完善,未来有很多工作需要进一步展开,也非常欢迎大家一起交流大模型技术。

2024-07-20 09:40:37 870

原创 这是我见过最棒的大模型干货!!!

Transformer与Seq2Seq各自有缺点Differential Equation基础选择性状态空间模型(SSMs)Discretization, Recurrent计算The HIPPO矩阵基于Pytorch实现一个基本的Mamba块。

2024-07-13 09:46:45 935

原创 再升级!视频理解大模型 CogVLM2 开源

目前,视频理解的主流方法涉及使用图像编码器从视频中提取帧,对其进行编码,然后设计编码压缩模块(如时间池化或Q-Former模块)来压缩视频编码信息,再将其输入大型语言模型(LLM)以便与文本输入进行联合理解。尽管这种方法有效地压缩了视频信息,但它使模型失去了时间感知能力,无法准确地将视频帧与精确的时间戳关联起来。因此,模型缺乏时间定位、时间戳检测和总结关键时刻的能力。为了解决这些问题,我们提出了CogVLM2-Video,这是基于CogVLM2图像理解模型的扩展视频模型。

2024-07-13 09:09:38 1036

原创 大模型知识问答: 文本分块要点总结

用较大chunk_size去字符切分文本,然后对大文本块用LLM做总结,作为摘要块加入向量数据库中。能在一定程度解决前面提到的问题1。

2024-07-08 22:32:39 1391

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除