数据派THU
码龄5年
  • 2,969,881
    被访问
  • 541
    原创
  • 428
    排名
  • 3,641
    粉丝
关注
提问 私信
  • 加入CSDN时间: 2017-08-07
博客简介:

数据派THU

博客描述:
发布清华大学数据科学相关科研动态、教学成果及线下活动
查看详细资料
个人成就
  • 获得1,777次点赞
  • 内容获得1,333次评论
  • 获得10,196次收藏
创作历程
  • 370篇
    2022年
  • 741篇
    2021年
  • 589篇
    2020年
  • 482篇
    2019年
  • 463篇
    2018年
  • 123篇
    2017年
成就勋章
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

【深度学习】小白看得懂的BERT原理

来源:机器学习初学者本文约4500字,建议阅读8分钟我们将研究BERT模型,理解它的工作原理,这个是NLP(自然语言处理)的非常重要的部分。导语自google在2018年10月底公布BERT在11项nlp任务中的卓越表现后,BERT(Bidirectional Encoder Representation from Transformers)就成为NLP领域大火,在本...
转载
发布博客 19 小时前 ·
9 阅读 ·
0 点赞 ·
0 评论

根据“气质”,AI可以准确识别婴儿年龄、性别

本文共1600字,建议阅读7分钟AI帮你“三岁看老”。仅根据外貌以及行为特征,例如婴儿表现出的恐惧、微笑或大笑,很难区分新生儿是男孩或女孩。但是一旦婴儿长到一岁左右,情况就会开始改变,不同新生儿的不同“气质”,就开始显现出来。PLOS ONE 的一项新研究使用机器学习分析了 4,438 名婴儿的“气质”数据,试图按性别和年龄对婴儿进行分类。结果表明,计算机算法根据婴儿出生...
转载
发布博客 19 小时前 ·
2 阅读 ·
0 点赞 ·
0 评论

GAN、DCGAN、WGAN、SRGAN 演变与改进

来源:信息网络工程研究中心本文共1000字,建议阅读5分钟本文带你了解GAN、DCGAN、WGAN、SRGAN。GAN生成网络接收一个随机噪声,生成逼真图像;判别网络接收一个图像,生成该图像是真实的概率(0~1);GAN网络中存在两个不同的网络,训练方式采用的是对抗训练方式,其中G的梯度更新信息来自于判别器D,而不是来自数据样本。GAN不适合处理离散形式的数据,比如文本...
转载
发布博客 前天 17:00 ·
3 阅读 ·
0 点赞 ·
0 评论

DeepMind「通才」AI智能体Gato来了,多模态、多任务,受大语言模型启发

来源:机器之心本文共2500字,建议阅读10+分钟在写文章、画图之后,AI 大模型现在又同时有了打游戏的能力。不禁在想,DeepMind 的智能体 Gato 未来还能玩出哪些花活?假如使用单一序列模型就能解决所有任务,是再好不过的事情,因为这种模型减少了不必要的麻烦。不过这需要增加训练数据的数量和多样性,此外,这种通用模型随着数据的扩充和模型的扩展,性能还会提高。从历史...
转载
发布博客 前天 17:00 ·
8 阅读 ·
0 点赞 ·
0 评论

独家 | 2022 年十项突破性技术

作者:Keysight翻译:陈之炎校对:zrx本文约2000字,建议阅读5分钟本文为你介绍2022年十项突破性技术。标签:突破性技术口令密码的终结过去的几十年里,通过网络工作时,往往需要输入口令密码,新的身份验证形式最终将会让我们永远摆脱口令密码,使用电子邮件、推送通知或生物识别扫描等全新的身份验证方式,不仅更加便捷,而且会更加安全。COVID 变体跟踪COV...
原创
发布博客 前天 17:00 ·
17 阅读 ·
0 点赞 ·
0 评论

人类首张银河中心超大黑洞照片公布

来源:机器之心本文共3000字,建议阅读5分钟银河系中心比我们想象的更活跃。5 月 12 日晚,在世界各地同时举行的新闻发布会上,天文学家们公布了银河系中心超大质量黑洞的第一张照片。这一结果提供了压倒性的证据,证明我们所在的星系中心确实是一个黑洞,并为此类巨星的运行提供了有价值的线索。一直以来,人们认为大多数星系的中心均存在巨型黑洞。该图像由一个名为事件视界望远镜(E...
转载
发布博客 2022.05.22 ·
12 阅读 ·
0 点赞 ·
0 评论

揭示世界本质的「机器科学家」,比深度神经网络还强?

来源:AI科技评论本文约5800字,建议阅读10分钟机器科学家能够发现一些我们没有发现的东西。我们正处于“GoPro 物理学”的风口浪尖。无论摄像机聚焦于什么事件,算法都可以识别其中潜在的物理方程。2017 年,西北大学化学与生物工程系的助理教授Roger Guimerà和罗维拉-威尔吉利大学的物理学教授Marta Sales-Pardo发现了细胞分裂的原因。该研究推动...
转载
发布博客 2022.05.22 ·
9 阅读 ·
0 点赞 ·
0 评论

AF-GCL:不需要增强的图对比学习

来源:Paperweekly本文共3500字,建议阅读5分钟本文介绍了在图对比学习中更为方便的AF-GCL模型。论文标题:Augmentation-Free Graph Contrastive Learning论文链接:https://arxiv.org/abs/2204.04874现有的图对比学习(GCL)模型依赖于图的增强,来学习在不同的增强图中保持不变的表示。作者...
转载
发布博客 2022.05.22 ·
9 阅读 ·
0 点赞 ·
0 评论

UNet 和 UNet++:医学影像经典分割网络对比

来源:极市平台本文约3000字,建议阅读5分钟本文介绍了医学影像经典分割网络的对比。介绍语义分割是计算机视觉的一个问题,我们的任务是使用图像作为输入,为图像中的每个像素分配一个类。在语义分割的情况下,我们不关心是否有同一个类的多个实例(对象),我们只是用它们的类别来标记它们。有多种关于不同计算机视觉问题的介绍课程,但用一张图片可以总结不同的计算机视觉问题:语义分割在生...
转载
发布博客 2022.05.21 ·
24 阅读 ·
0 点赞 ·
0 评论

Michael Page:2022人才趋势报告

来源:数据局本文多图,建议阅读5分钟本文为你分享2022人才趋势报告。
转载
发布博客 2022.05.21 ·
11 阅读 ·
0 点赞 ·
0 评论

多目标追踪小抄:快速了解MOT的基本概念

来源:Deephub Imba本文共2400字,建议阅读5分钟本文介绍了MOT的基本概念。多目标跟踪(Multiple Object Tracking)MOT 获取单个连续视频并以特定帧速率 (fps) 将其拆分为离散帧以输出。检测每帧中存在哪些对象标注对象在每一帧中的位置关联不同帧中的对象是属于同一个对象还是属于不同对象MOT的典型应用多目标跟踪(MOT)用于交通控制...
转载
发布博客 2022.05.21 ·
74 阅读 ·
0 点赞 ·
0 评论

万字专栏总结 | 离线强化学习(OfflineRL)总结(原理、数据集、算法、复杂性分析、超参数调优等)...

本文来源自知乎博客,作者:旺仔搬砖记本文约13000字,建议阅读16分钟本文详细的阐述了强化学习到离线强化学习的发展过程,并就一些经典的问题进行了解释和说明。由于内容过长,本文仅展示部分内容,完整系列博客请文末阅读原文。离线强化学习(Offline RL)作为深度强化学习的子领域,其不需要与模拟环境进行交互就可以直接从数据中学习一套策略来完成相关任务,被认为是强化学习落...
转载
发布博客 2022.05.20 ·
76 阅读 ·
1 点赞 ·
0 评论

谷歌让机器人充当大语言模型的手和眼,一个任务拆解成16个动作一气呵成

来源:机器之心本文共2000字,建议阅读5分钟本文介绍了机器人在大语言模型中的进展。大模型在机器人领域找到了用武之地。「我把饮料撒了,你能帮我一下吗?」这是我们日常生活中再正常不过的一句求助语。听到这句话,你的家人或朋友往往会不假思索地递给你一块抹布、几张纸巾或直接帮你清理掉。但如果换成机器人,事情就没有那么简单了。它需要理解「饮料撒了」、「帮我一下」是什么意思,以及到...
转载
发布博客 2022.05.20 ·
9 阅读 ·
0 点赞 ·
0 评论

【ICML2022】可达性约束强化学习

来源:专知本文为论文,建议阅读5分钟本文提出了一种可达性CRL (RCRL)方法,利用可达性分析来刻画最大可行集。约束强化学习(CRL)最近引起了人们的极大兴趣,因为满足安全约束对现实世界的问题至关重要。然而,现有的CRL方法对折现累积成本的约束通常缺乏严格的定义和安全性保证。另一方面,在安全控制研究中,安全被定义为持续满足一定的状态约束。这种持久安全只在状态空间的一...
转载
发布博客 2022.05.20 ·
32 阅读 ·
0 点赞 ·
0 评论

基于图注意力机制和Transformer的异常检测

来源:专知本文为论文,建议阅读6分钟本文提出了一种基于图注意力和Transformer的异常检测模型。异常检测对电力行业的发展有着重要的影响,如何根据大规模电力数据进行异常检测是重要的研究热点.目前,大多数研究通过聚类或神经网络进行异常检测. 但是这些方法忽略了时序数据之间潜在的关联关系及某些特点的重要信息,没有充分挖掘出数据的潜在价值. 因此,提出了一种基于图注意力和...
转载
发布博客 2022.05.19 ·
64 阅读 ·
0 点赞 ·
0 评论

3D 可视化卷积、池化!终于能看懂神经网络到底在干啥了...

来源:量子位(公众号id:qbitai)本文约1100字,建议阅读6分钟神经网络在工作的时候,里面到底是什么样?为了能透视这个“AI黑箱”中的过程,加拿大蒙特利尔一家公司开发一个3D可视化工具Zetane Engine。只需要上传一个模型,Zetane Engine就可以巡视整个神经网络,并且还可以放大网络中的任何一层,显示特征图,看清流水线上的每一步:△图注:卷积层...
转载
发布博客 2022.05.19 ·
21 阅读 ·
0 点赞 ·
0 评论

【CVPR2022】循环动态嵌入的视频目标分割

来源:专知本文为论文,建议阅读5分钟我们设计了一种新的自校正策略,使网络能够修复存储库中不同质量的掩模嵌入。基于时空记忆(STM)的视频对象分割(VOS)网络通常每隔几帧不断增加存储库,表现出良好的性能。然而,1)随着视频长度的增加,硬件无法承受不断增长的内存需求。2)存储大量的信息不可避免地会引入大量的噪声,这不利于从存储库中读取最重要的信息。在本文中,我们提出一种循...
转载
发布博客 2022.05.18 ·
21 阅读 ·
0 点赞 ·
0 评论

只需要十分之一数据,就能通关四大视觉任务,居然还开源了!

本文约5800字,建议阅读10分钟OpenGVLab开源超高性能预训练模型,节省90%数据量!分类、目标检测、语义分割、深度估计,四大任务一网打尽!Github链接:https://github.com/opengvlab家人们,你们有没有这种苦恼?搬一次家就换一次家具,那些又贵又重的家具既不好搬运,又不好全部带走。下一次又重新购置一遍家具,浪费钱不说,关键是来来回回都...
转载
发布博客 2022.05.17 ·
545 阅读 ·
0 点赞 ·
0 评论

ICLR 2022的10篇论文推荐

来源:DeepHub IMBA本文约4800字,建议阅读10+分钟本文与你分享ICLR 2022的机器学习研究相关论文。一、Autoregressive Diffusion ModelsEmiel Hoogeboom, Alexey A. Gritsenko, Jasmijn Bastings, Ben Poole, Rianne van den Berg, Tim ...
转载
发布博客 2022.05.17 ·
88 阅读 ·
0 点赞 ·
0 评论

多任务学习模型ESMM原理与实现(附代码)

来源:DataFunTalk本文约2500字,建议阅读5分钟文章基于 Multi-Task Learning (MTL) 的思路,提出一种名为ESMM的CVR预估模型。[ 导读 ]本文介绍的是阿里巴巴团队发表在 SIGIR’2018 的论文《Entire Space Multi-Task Model: An Effective Approach for Estimat...
转载
发布博客 2022.05.16 ·
29 阅读 ·
0 点赞 ·
0 评论
加载更多