机器学习
文章平均质量分 86
机器学习
机器学习社区
这个作者很懒,什么都没留下…
展开
-
入门 PyTorch ,这70个操作技巧就够了
掌握以上19种操作方法可以让你更好地使用 PyTorch 进行深度学习任务。这些操作方法涵盖了张量的创建、变换、数学运算、梯度计算、模型构建、数据处理等方面,是使用 PyTorch 进行深度学习的基础操作。原创 2024-06-25 21:51:00 · 1092 阅读 · 0 评论 -
推荐收藏!40 道算法工程师必问的高频面试题!
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。春招真的很卷,想要春招上岸的同学,一定要认真准备起来了今天给大家整理了40道算法工程师面试高频题,找算法工程师岗位的同学要码住认真看噢✅ 面试题1:请你说说回归问题可以设置支持向量机吗?2:介绍一下SVM,遇到线性不可分怎么办,核函数有什么特点?原创 2024-05-05 22:56:54 · 725 阅读 · 0 评论 -
《机器学习算法面试宝典》重磅发布!
我们经常会组织场算法岗技术&面试讨论会,会邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。基于讨论和经验总结,历时半年的梳理和修改,《机器学习算法面试宝典》(以下简称《算法面试宝典》)终于可以跟大家见面了。原创 2024-05-05 22:38:03 · 1031 阅读 · 0 评论 -
推荐收藏!商汤智能座舱算法岗面试题7道(含解析)!
BERT(Bidirectional Encoder Representations from Transformers)是一种预训练的自然语言处理模型,基于Transformer架构。BERT的核心思想是通过在大规模语料库上进行无监督训练,从而学习丰富的语言表示。BERT采用双向(bidirectional)的注意力机制,能够更好地理解上下文信息。在预训练之后,BERT可以通过微调应用于各种下游任务,如文本分类、命名实体识别等。原创 2024-02-26 21:49:02 · 1547 阅读 · 0 评论 -
马赛克,克星,真来了!v2.0
大家好,今天继续聊聊 AI 开源项目。原创 2023-12-12 22:33:37 · 249 阅读 · 0 评论 -
我爱上这38个酷炫的数据大屏(附 Python 源码)
随着大数据的发展,可视化大屏在各行各业得到越来越广泛的应用。可视化大屏不再只是电影里奇幻的画面,而是被实实在在地应用在政府、商业、金融、制造等各个行业的业务场景中,切切实实地实现着大数据的价值。所以本着学习的态度,我开发了38款开源的可视化大屏(含源码)。原创 2023-12-02 22:53:20 · 787 阅读 · 0 评论 -
10大面试必备的排序算法 Python 实现(附源码)
今天给大家分享一篇关于Python实现排序算法的文章,来自GitHub。排序算法是《数据结构与算法》中最基本的算法之一。排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。等。原创 2023-01-28 20:18:44 · 564 阅读 · 0 评论 -
把代码贴进去自动找bug,这个debug神器自动修复仅需几秒
调试过程如下:Adrenaline 将代码和错误信息发送到 OpenAI 编辑与插入 API ( code-davinci-edit-001),该 API 会发回可能修复错误的代码编辑。但在作者的构想中,未来的 Adrenaline 将会有更丰富的功能。请注意,使用 Adrenaline 的前提是,用户必须从 OpenAI 控制台提供自己的 OpenAI API 密钥。鉴于 Codex 的补全功能是基于 GPT-3 的,所以 Adrenaline 也多了一项特色 Debug 功能:解释 Bug。原创 2023-01-17 23:13:21 · 864 阅读 · 0 评论 -
只从 2022 年算起,谷歌就向社会输送了至少 26 位高端 AI 人才。
值得注意的是,《Attention is all you need》论文的作者之一 Aidan Gomez 就是 Cohere For AI 的联合创始人兼 CEO,他也曾在 Google Brain 实习。特别是 Transformer 的论文作者,其中已有六位推出了自己的创业公司,还有一位已经加入 OpenAI,仅余一位还在谷歌工作。前谷歌 AI 伦理部门的高级研究员,现在是分布式 AI 研究所(DAIR)的研究主任,DAIR 是由之前被谷歌解雇的女研究员 Timnit Gebru 成立的初创公司。原创 2022-12-28 22:34:19 · 916 阅读 · 0 评论 -
2022出圈的ML研究:爆火的Stable Diffusion、通才智能体Gato,LeCun转推
来自 Meta AI 的研究者发布了翻译模型 NLLB(No Language Left behind ),直译为「一个语言都不能少」,其可以支持 200 + 语言之间的任意互译,除了中英法日等常用语种翻译外,NLLB 还能对包括卢干达语、乌尔都语等在内的许多小众语言进行翻译。Make-A-Video 有三个优点:(1)它加速了 T2V(Text-to-Video)模型的训练,不需要从头开始学习视觉和多模态表示,(2)它不需要配对的文本 - 视频数据,(3)生成的视频继承了当今图像生成模型的多项优点。原创 2022-12-26 22:10:29 · 709 阅读 · 0 评论 -
一文深度剖析扩散模型究竟学到了什么?
本研究的目的是评估扩散模型是否能够从其训练数据中复制高保真内容,根据作者的结论不难发现这种现象是普遍存在的。虽然大规模模型的典型图像似乎不包含我们的特征提取器可检测到的复制内容,但复制似乎出现得足够频繁,以至于它们的存在不容易被忽略;如下图所示,数据集相似度 ≥.5 的稳定扩散图像占整体随机生成的约 1.88%.图 7. 使用从 LAION 图像中采样的字幕选择的稳定扩散生成,相似度得分 ≥ 0.5。其实在中对复制的搜索仅涵盖了LAION。原创 2022-12-18 09:59:29 · 1851 阅读 · 0 评论 -
【谷歌新作】Transformer杀入机器人领域,RT-1:97%成功率,轻松完成700多条控制指令
机器人的动作维度包括手臂运动的 7 个变量(x、y、z、翻转、俯仰、摇摆、打开夹具)、3 个基本运动变量(x、y、摇摆)以及一个在控制臂、控制 base 或终止 episode 三种模式之间切换的额外具体变量。SayCan 算法是谷歌在今年提出的,在这个算法中,谷歌让机器人充当语言模型的「手和眼睛」,而语言模型提供有关任务的高级语义知识。为了进一步挖掘 RT-1 的性能,该团队还将训练另一个机器人的数据用来训练 RT-1,目的有两个:(1) 测试模型在新数据上是否保持其在原始任务上的性能;原创 2022-12-17 18:09:55 · 1730 阅读 · 0 评论 -
10000+字,利用 Python 进行泰坦尼克生存预测
大家好,Titanic数据是一份经典数据挖掘的数据集,本文介绍的是kaggle排名第一的案例分享。原notebook地址:https://www.kaggle.com/startupsci/titanic-data-science-solutions。原创 2022-12-10 14:09:47 · 318 阅读 · 0 评论 -
时序预测的7种 Python 工具包,解决你95%的问题
欢迎关注我,专注Python、数据分析、数据挖掘、实用工具!时间序列问题是数据科学中最难解决的问题之一。传统的处理方法如 ARIMA、SARIMA 等,虽然是很好,但在处理具有非线性特性或非平稳时间序列问题时很难取得满意的预测效果。为了获得更好的预测效果,并且可以简单高效的完成任务,本文中我将分享给大家7个用于处理时间序列问题的 Python 工具包,。原创 2022-12-08 23:23:38 · 1026 阅读 · 0 评论 -
【推荐学习收藏】9种回归算法及实例总结的太详细了
我相信很多人跟我一样,学习机器学习和数据科学的第一个算法是线性回归,它简单易懂。由于其功能有限,它不太可能成为工作中的最佳选择。大多数情况下,线性回归被用作基线模型来评估和比较研究中的新方法。在处理实际问题时,你应该了解并尝试许多其他回归算法。一方面可以系统学习回归算法,另外一方面在面试中也常用到这些算法。在本文中,我们将通过使用 Scikit-learn 和 XGBoost 的动手实践来学习 9 种流行的回归算法。原创 2022-12-08 23:20:36 · 1252 阅读 · 0 评论 -
Github 上最大的开源算法库,还能学机器学习
算法对于每个程序员来说,都是非常重要的。大厂面试,也是100%会问到算法面试题。学习算法大家都知道被称为刷题神器的 LeetCode ,今天我再向大家推荐两个各具特色的开源算法库,可以配合着 LeetCode 一起学习,效果更好哦。https://the-algorithms.com/zh_Hans这个网站是 GitHub 最大的开源算法库,支持许多编程语言。每种语言都有自己的GitHub仓库,其中存储了所有算法代码。以 Python 为例,不但可以直接运行,代码也都是开源的,直接从Github clone原创 2022-12-06 22:42:12 · 382 阅读 · 0 评论 -
Stack Overflow 临时禁用 ChatGPT 生成内容,网友:人类和AI快打起来!
要问最近 AI 圈哪个模型最火爆,你不得不把 OpenAI 推出的 ChatGPT 排在前面。自从发布以来,这个对话模型可谓是出尽风头,很多人更是对其产生了一百个新玩法,让它写个代码、修改修改 bug、开发个小游戏、解答一下物理知识、去参加一场考试…… 仿佛没有它不会的。「上周三才上线的 ChatGPT,短短几天它的用户已经突破 100 万大关!」OpenAI 的 CEO Sam Altman 表示。就连马斯克都忍不住好奇的问了一句:「你们每次聊天的平均成本是多少?」「每次聊天的平均费用可能只有个位数,我们原创 2022-12-06 22:29:37 · 2126 阅读 · 0 评论 -
模型效果不好?推荐你8种机器学习调参技巧
大家好,今天给大家一篇关于机器学习调参技巧的文章是机器学习例程中的基本步骤之一。该方法也称为,需要搜索超参数的最佳配置以实现最佳性能。机器学习算法需要用户定义的输入来实现准确性和通用性之间的平衡。这个过程称为超参数调整。有多种工具和方法可用于调整超参数。我们整理了一份用于调整机器学习模型超参数的前八种方法的列表。贝叶斯优化已成为机器学习算法超参数调整的有效工具,更具体地说,适用于深度神经网络等复杂模型。它提供了一个有效的框架来优化昂贵的黑盒功能,而无需知道它的形式。它已应用于多个领域,包括学习最优机器人力学原创 2022-12-04 10:04:33 · 1621 阅读 · 0 评论 -
讲透金融风控建模全流程(附 Python 代码)
信贷风控是数据挖掘算法最成功的应用之一,这在于金融信贷行业的数据量很充足,需求场景清晰及丰富。信贷风控简单来说就是判断一个人借了钱后面(如下个月的还款日)会不会按期还钱。更专业来说,信贷风控是还款能力及还款意愿的综合考量,根据这预先的判断为信任依据进行放贷,以此大大提高了金融业务效率。本文内容较长,喜欢记得收藏、点赞。与其他机器学习的工业场景不同,金融是极其厌恶风险的领域,其特殊性在于非常侧重模型的解释性及稳定性。业界通常的做法是基于挖掘多维度的特征建立一套可解释及效果稳定的规则及风控模型对每笔订单/用户原创 2022-12-03 15:55:41 · 2863 阅读 · 2 评论 -
【实战案例】Python 信用卡欺诈检测其实特简单
当我们在网上购买产品时,很多人喜欢使用信用卡。但信用卡欺诈常常会在身边发生,网络安全正成为我们生活中至关重要的一部分。为了解决这个问题,我们需要利用机器学习算法构建一个异常行为的识别系统,如果发现可疑,中止操作。在本文中,我将分享一个端到端模型训练方法,从数据获取到最后模型筛选,喜欢的小伙伴欢迎收藏、点赞支持。本文由技术群粉丝分享,项目源码、数据、技术交流提升,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友本文使用的为 kaggle 数据:,该数据集为原创 2022-12-03 15:49:25 · 1483 阅读 · 0 评论 -
手把手教你利用 LSTM 模型预测亚马逊股票价格
机器学习是指一套工具或方法,凭借这套工具和方法,利用历史数据对机器进行"训练"进而"学习"到某种模式或规律,并建立预测未来结果的模型。,主要用于决策支持,它利用有标识的历史数据进行训练,以实现对新数据的标识的预测。方法主要包括聚类。在日常工作中,预测(回归)是我们经常用到的场景。今天我将手把手分享一个实战项目:如何使用长期记忆(LSTM)预测股票价格。原创 2022-11-28 22:46:53 · 952 阅读 · 0 评论 -
不容错过,机器学习样本不平衡策略和方法这篇太全了
在银行要判断一个"新客户是否会违约",通常不违约的人VS违约的人会是99:1的比例,真正违约的人 其实是非常少的。这种分类状况下,即便模型什么也不做,全把所有人都当成不会违约的人,正确率也能有99%, 这使得模型评估指标变得毫无意义,根本无法达到我们的"要识别出会违约的人"的建模目的。像这样样本不均衡等例子在生活中随处可见。通常出现在异常检测、客户流失、罕见时间分析、发生低频率事件等场景,具体如垃圾邮件等识别,信用卡征信问题、欺诈交易检测、工厂中不良品检测等。原创 2022-11-28 22:44:02 · 299 阅读 · 0 评论 -
【实战案例】分享6种常用的信用卡欺诈检测算法(附 Python 代码)
假设你受雇于帮助一家信用卡公司检测潜在的欺诈案件,你的工作是确保客户不会因未购买的商品而被收取费用。给你一个包含人与人之间交易的数据集,他们是欺诈与否的信息,并要求你区分它们。我们的最终目的是通过构建分类模型来对欺诈交易进行分类区分来解决上述情况。经过一连串的过程,我们已经成功构建了从决策树模型到XGBoost模型的六种不同类型的分类模型。随后使用评估指标评估了每个模型,并选择了最适合给定案例的模型。在本文中,我们只选用了6个相对流行的模型,其实还有更多模型需要探索。原创 2022-11-27 22:22:45 · 2488 阅读 · 2 评论 -
一文汇总机器学习超参自动优化方法(附Python代码)
上面我们用Iris鸢尾花数据集试了不同的超参自动调优方法,发现贝叶斯优化和随机搜索都比格子搜索好。从一些论文反映,贝叶斯优化是更香的,但是贝叶斯优化好像在实践中用的不是那么多,网上也有很多分享者,像Nagesh Singh Chauhan,说的那样:[10]为什么呢?我想原因是贝叶斯的开销太大了,前面有提到,在每次循环选超参值的时候,贝叶斯优化都需要将 带入昂贵的目标函数 中,去得到输出值y,当目标函数特别复杂时,这种情况的评估开销是很大的,更何况随着搜索空间和搜索次数的变大,计算会越发昂贵。原创 2022-11-14 22:13:45 · 404 阅读 · 0 评论 -
一文解决样本不均衡(全)
通过某种方法使得不同类别的样本对于模型学习中的Loss(或梯度)贡献是比较均衡的。具体可以从数据样本、模型算法、目标函数、评估指标等方面进行优化,其中数据增强、代价敏感学习及采样+集成学习是比较常用的,效果也是比较明显的。其实,不均衡问题解决也是结合实际再做方法选择、组合及调整,在验证中调优的过程。一、样本不均衡的介绍1.1 样本不均衡现象样本(类别)样本不平衡(class-imbalance)指的是分类任务中不同类别的训练样例数目差别很大的情况,一般地,样本类别比例(Imbalance Ratio)原创 2022-04-07 08:28:42 · 1412 阅读 · 0 评论 -
17个机器学习的常用算法
根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法的学习方式。在机器学习领域,有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法,这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。1. 监督式学习:在监督式学习下,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,对手写数字识别中的“1“,”2“,”3“,”4“等。在建立预测模型的时候,监督式学.原创 2022-04-03 10:14:20 · 2640 阅读 · 0 评论 -
危险,AI 会自己写代码了
大家好,这周四,DeepMind 的 “Alpha” 家族再添一名新成员:会刷编程竞赛题的 AlphaCode 来了!其实,AlphaCode 早在几个月前就“悄悄进村”了,一直没人察觉。它默默参加了著名网站 Codeforces 最近举行的10场编程比赛,成绩超过了一半人类。直到最近 DeepMind 才公布最终成绩:AlphaCode 在这 10 场比赛中排名前54.3%,Elo 评分1238。更重要的是,在编程比赛这样考察算法创造力的问题中,AI终于不落下风,而这恰恰是AI过去所欠缺的。原创 2022-02-07 16:36:23 · 876 阅读 · 0 评论 -
值得收藏,VScode 中这 15 个神仙插件写代码必备
Visual Studio Code 是一款轻量级但功能强大的源代码编辑器,适用于 Windows、macOS 和 Linux。内置了对 JavaScript、TypeScript 和 Node.js 的支持,并为其他语言(例如 C++、C#、Java、Python、PHP、Go)并且提供了丰富的扩展生态系统。今天我将给大家介绍下VS Code常用操作及非常棒的插件,喜欢本文记得收藏、点赞、关注。废话不多说,我们开始吧!使用教程1.搜索扩展您可以清除“扩展”视图顶部的“搜索”框,然后输入您要查找的扩展、工具原创 2022-02-04 16:41:22 · 3160 阅读 · 0 评论 -
我删掉了Transformer中的这几层…性能反而变好了?
基于Transformer结构的各类语言模型(Bert基于其encoder,Gpt-2基于其decoder)早已经在各类NLP任务上大放异彩,面对让人眼花缭乱的transformer堆叠方式,你是否也会感到迷茫?没关系,现在让我们回到最初,再次看看transformer 本来的模样——Rethinking the Value of Transformer Components。该文收录已于COLING 2020。众所周知,一个完整的transformer结构可以切分成Encoder-self attent原创 2022-02-03 10:26:25 · 430 阅读 · 0 评论 -
超越现有指标57.3%,邢波教授、胡志挺教授团队提出统一NLG评价框架
近日,CMU邢波(Eric Xing)教授和UCSD胡志挺(Zhiting Hu)教授的团队提出用一种运算符,统一各类生成任务的评价方式,为未来各种新任务、新要求提供了更加统一的指导。实验表明,基于统一框架设计的评价指标,在多个任务上超过了现有指标与人工评分的相似度,现在通过PyPI和GitHub可以直接调用。自然语言生成(NLG)包括机器翻译、摘要生成、机器对话等自然语言处理 (NLP)任务。这些任务虽然都要求生成通顺的文本,但是最终的表达目标原创 2022-01-28 21:27:33 · 772 阅读 · 0 评论 -
推荐掌握机器学习特征工程这9个使用技巧
特征是什么?为什么需要工程设计?基本上,所有机器学习算法都是将一些输入数据转化为输出。这些输入数据包括若干特征,通常是以由列组成的表格形式出现。而算法往往要求输入具有某些特性的特征才能正常工作。因此,出现了对特征工程的需求。特征工程至少有两个目标,构建适合机器学习算法要求的输入数据。改善机器学习模型的性能。根据《福布斯》的一项调查,数据科学家把 80% 左右的时间花在数据收集、清晰以及预处理等数据准备上。这点显示了特征工程在数据科学中的重要性。因此有必要整理一下特征工程的主要技术。原创 2022-01-28 16:43:09 · 281 阅读 · 0 评论 -
滴滴程序员被亲戚鄙视:年薪八十万还不如二本教书的...
这个话题,在脉脉和知乎都登上了热搜:简单谈谈我的看法,从发帖人的言语来说,还是略微带有一丝自豪感和骄傲感的,心中大概率认为二本教书的亲戚孩子是不如自己的,毕竟「我一年就挣他快5、6年的工资了」。无疑的是,发帖人还是非常单纯的思考这个问题,简单的将工资作为衡量发展好坏的唯一要素,这样很容易陷入局部思维。程序员作为当下薪资报酬较高的一个群体,的确给很多从事其中的人在短期内带来了很多的回报,但从整体性价比上,是否能够优于二本老师,以下几点有待商榷:个人自由程度,目前程序员,尤其是滴滴这样一线大厂的高薪程序员,已经原创 2022-01-28 15:20:24 · 6369 阅读 · 0 评论 -
机器学习算法:一文解决数据样本不均衡问题
一、样本不均衡的介绍1.1 样本不均衡现象样本(类别)样本不平衡(class-imbalance)指的是分类任务中不同类别的训练样例数目差别很大的情况,一般地,样本类别比例(Imbalance Ratio)(多数类vs少数类)明显大于1:1(如4:1)就可以归为样本不均衡的问题。现实中,样本不平衡是一种常见的现象,如:金融欺诈交易检测,欺诈交易的订单样本通常是占总交易数量的极少部分,而且对于有些任务而言少数样本更为重要。注:本文主要探讨分类任务的类别不均衡,回归任务的样本不均衡详见《Delving原创 2022-01-27 15:41:28 · 4994 阅读 · 0 评论 -
一文读懂异常检测 LOF 算法(Python代码)
本篇介绍一个经典的异常检测算法:局部离群因子(Local Outlier Factor),简称LOF算法。背景Local Outlier Factor(LOF)是基于密度的经典算法(Breuning et. al. 2000), 文章发表于 SIGMOD 2000, 到目前已经有 3000+ 的引用。在 LOF 之前的异常检测算法大多是基于统计方法的,或者是借用了一些聚类算法用于异常点的识别(比如 ,DBSCAN,OPTICS)。这些方法都有一些不完美的地方:基于统计的方法:通常需要假设数据服从特定的概率分原创 2022-01-27 15:35:38 · 2716 阅读 · 1 评论 -
深度盘点:机器学习中必知必会的四种调参方法
维基百科上说,“Hyperparameter optimization或tuning是为学习算法选择一组最优的hyperparameters的问题”。ML工作流中最困难的部分之一是为模型找到最好的超参数。ML模型的性能与超参数直接相关。超参数调优的越好,得到的模型就越好。调优超参数可能是非常乏味和困难的,更像是一门艺术而不是科学。超参数超参数是在建立模型时用于控制算法行为的参数。这些参数不能从常规训练过程中获得。在对模型进行训练之前,需要对它们进行赋值。超参数的简单列表内容传统的手工调.原创 2022-01-27 15:29:56 · 183 阅读 · 0 评论 -
面试最常考、最常用的10大机器学习算法
在机器学习领域,有种说法叫做“世上没有免费的午餐”,简而言之,它是指没有任何一种算法能在每个问题上都能有最好的效果,这个理论在监督学习方面体现得尤为重要。举个例子来说,你不能说神经网络永远比决策树好,反之亦然。模型运行被许多因素左右,例如数据集的大小和结构。因此,你应该根据你的问题尝试许多不同的算法,同时使用数据测试集来评估性能并选出最优项。当然,你尝试的算法必须和你的问题相切合,其中的门道便是机器学习的主要任务。打个比方,如果你想打扫房子,你可能会用到吸尘器、扫帚或者拖把,但你肯定不会拿把铲子开始挖原创 2022-01-27 11:18:55 · 1118 阅读 · 0 评论 -
全网最全:机器学习算法模型自动超参数优化方法汇总
什么是超参数?学习器模型中一般有两类参数,一类是可以从数据中学习估计得到,我们称为参数(Parameter)。还有一类参数时无法从数据中估计,只能靠人的经验进行设计指定,我们称为超参数(Hyper parameter)。超参数是在开始学习过程之前设置值的参数。相反,其他参数的值通过训练得出。超参数:定义关于模型的更高层次的概念,如复杂性或学习能力 不能直接从标准模型培训过程中的数据中学习,需要预先定义 可以通过设置不同的值,训练不同的模型和选择更好的测试值来决定 参数空间的搜索一般由以下几个部分构成:原创 2022-01-25 16:31:54 · 1958 阅读 · 0 评论 -
【论文解读】训练更快,泛化更强的Dropout:Multi-Sample Dropout
论文简介:大幅减少训练迭代次数,提高泛化能力:Multi-Sample Dropout论文标题:Multi-Sample Dropout for Accelerated Training and Better Generalization 论文链接:https://arxiv.org/pdf/1905.09788.pdf论文作者:{Hiroshi Inoue}1论文简介本文阐述的也是一种 dropout 技术的变形——multi-sample dropout。传统 dropout 在每轮训练时会从原创 2022-01-24 14:30:03 · 132 阅读 · 0 评论 -
Jeff Dean长文展望:2021年之后,机器学习领域的五大潜力趋势
2021 年之后,机器学习将会对哪些领域产生前所未有的影响?在过去的数年,见证了机器学习(ML)和计算机科学领域的许多变化。按照这种长弧形的进步模式,人们或许将在接下来的几年中看到许多令人兴奋的进展,这些进步最终将造福数十亿人的生活,并产生比以往更深远的影响。 在一篇总结文章中,谷歌 AI 负责人、知名学者 Jeff Dean 重点介绍了 2021 年之后机器学习最具潜力的五个领域:趋势 1:能力、通用性更强的机器学习原创 2022-01-24 14:27:07 · 174 阅读 · 0 评论 -
1370亿参数、接近人类水平,谷歌对话AI模型LaMDA放出论文
谷歌的 LaMDA 具有接近人类水平的对话质量。语言模型可以完成不同任务,例如将一种语言翻译成另一种语言,将长文档总结为简短的摘要等。在众多任务中,开放域对话可能是最困难的任务之一,因为开放域对话需要模型覆盖不同的主题。在对话任务中,模型应该遵循负责任 AI(Responsible AI)实践,并避免做出没有外部信息源支持的事实陈述。近日,超过 50 多位谷歌研究者参与撰写的论文《 LaMDA: Language Models for Dialog Applications 》介绍了语言模型 LaM.原创 2022-01-23 14:05:26 · 1863 阅读 · 0 评论