自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据派THU

发布清华大学数据科学相关科研动态、教学成果及线下活动

  • 博客(47)
  • 收藏
  • 关注

转载 熬10天夜,肝出了这个PDF版“软件安装手册”(附下载)

来源:CodeSheep全文约1100字,建议阅读18分钟您可阅读至文末安装~标签:编程开发嗯 ?woc,这个学期过了就要找工作了,之前看羊子发的那个“Java后端开发学习路线图&#34...

2020-05-31 17:00:00 577

转载 一文读懂深度学习中的各种卷积

来源:机器之心本文长度为7200字,建议阅读10分钟本文归纳总结深度学习中常用的几种卷积,并会试图用一种每个人都能理解的方式解释它们。如果你听说过深度学习中不同种类的卷积(比如 2D /...

2020-05-31 17:00:00 708

转载 绝悟之后再超神,腾讯30篇论文入选AI顶会ACL

授权自AI科技大本营(ID:rgznai100)全文约3400字,建议阅读15分钟本文为大家深度解读一下这30篇论文背后丰富的技术内涵。近日,国际计算语言学协会年会ACL在官网(http...

2020-05-30 17:00:00 795

转载 模型的跨界:我拿Transformer去做目标检测,结果发现效果不错

来源:机器之心本文长度为2400字,建议阅读10分钟本文介绍了将Transformer用到了目标检测任务中,取得的效果。标签:计算机视觉自 2017 年被提出以来,Transformer...

2020-05-30 17:00:00 825 1

转载 这场大数据+AI Meetup,一次性安排了大数据当下热门话题

近年来,随着工业界多年的努力以及新兴技术的不断涌现,数据规模庞大的问题已逐步得到解决,而数据处理的时效性、数据价值的挖掘正成为企业及开发者面临的新的巨大挑战。也因此,大数据计算引擎、AI...

2020-05-29 17:00:00 739

转载 五位工程师亲述:AI技术人才如何快速成长?

来源:AI前线本文长度为12000字,建议阅读10分钟本文与你分享AI技术人才的真实成长经历。标签:人工智能前言参考塞缪尔. 约翰逊(18 世纪英国文学评论家、诗人,著有《英语大辞典》、...

2020-05-29 17:00:00 1741

转载 强者愈强!疫情拉大“数据资产”贫富差距,顶级公司数据建设靠什么

5月12日,谷歌子公司Waymo宣布获得7.5亿美元的额外投资,将无人驾驶汽车商业化。两个月内,Waymo的筹款额已经达到了30亿美元。阿里云计算收入同比增长58%,新零售平台在疫情影响...

2020-05-27 17:00:00 503

原创 独家 | 机器学习中的四种分类任务(附代码)

作者:Jason Brownlee翻译:陈丹校对:杨毅远全文约4400字,建议阅读18分钟本文为大家介绍了机器学习中常见的四种分类任务。分别是二分类、多类别分类、多标签分类、不平衡分类,...

2020-05-27 17:00:00 2640

原创 独家 | 数据科学入门指南:新手如何步入数据科学领域?

作者:Sangeet Aggarwal翻译:陈之炎校对:冯羽本文长度为2900字,建议阅读6分钟本文将带大家讨论如何从零开始数据科学之旅。标签:数据科学,机器学习数据科学,据说是本世纪...

2020-05-26 17:00:00 574

转载 收藏 | Google 发布官方中文版机器学习术语表

来源:机器学习算法与Python学习本文长度为16000字,建议阅读10+分钟本文与你分享一般的Machine Learning术语和 TensorFlow 专用术语的定义。标签:机器学...

2020-05-26 17:00:00 784

原创 原创|一文读懂主成分分析(PCA)

作者:贾恩东本文长度为2500字,建议阅读7分钟这篇文章主要带大家入门PCA,逐渐理解PCA最原始的概念和设计思路,以及简单的实现原理。主成分分析,即Principle Componen...

2020-05-25 17:00:00 2604

转载 国内NLP竞赛平台一览(附平台连接)

来源:NLP有品本文约700字,建议阅读10分钟本文为大家分享国内NLP竞赛平台。标签:自然语言处理“白嫖数据的圣地,NLP技能的训练场”,当你觉得学好了NLP技能想练手却苦于没有数据...

2020-05-25 17:00:00 10901 1

转载 卷积神经网络中10大拍案叫绝的操作!

来源:AI蜗牛车本文约4000字,建议阅读8分钟。本文我们从变革性工作中探讨日后的CNN变革方向。标签:人工智能技术从2012年的AlexNet发展至今,科学家们发明出各种各样的CNN模...

2020-05-24 17:00:00 479

转载 百度语义解析 ( Text-to-SQL ) 技术研究及应用

来源:DataFunTalk本文长度为6500字,建议阅读10+分钟本文介绍自然语言问题转成数据库可操作的SQL查询语句的应用。[ 导读 ]语义解析( Semantic Parsing...

2020-05-24 17:00:00 5287

转载 送你一份概率图模型笔记

来源:NewBeeNLP本文长度为2700字,建议阅读6分钟本文为你分享一份概率图模型学习笔记,一起交流。写在前面其实接触概率图模型也有一段时间了,从开始入坑NLP起,也陆陆续续看了很多...

2020-05-23 19:23:00 523

转载 AI表情包生成器来了!给AI喂了96万个表情包文案,做出的图能接地气吗?

来源:大数据文摘本文长度为1400字,建议阅读5分钟本文为你介绍AI表情包生成器,一起来斗图吧!在这个一言不合就斗图的年代,表情包已经成为了人人必需的“装备”。最近,我们就发现一位外国友...

2020-05-22 17:00:00 733

原创 独家 | 浅析机器学习中的自由度

作者:Jason Browniee翻译:张若楠校对:林鹤冲本文长度为2800字,建议阅读8分钟本文介绍了自由度的概念,以及如何判断统计学模型和机器学习模型中的自由度。标签:数据处理自由度...

2020-05-22 17:00:00 1353

转载 数据安全最佳实践案例库建设项目案例征集

2020年5月15日,由清华大学大数据研究中心和大数据系统软件国家工程实验室联合发起的数据安全最佳实践案例库建设项目正式启动。清华大学大数据研究中心和大数据系统软件国家工程实验室作为我国...

2020-05-21 17:00:00 752

转载 开启注册丨ACL-IJCAI-SIGIR顶级会议论文报告会(AIS 2020)

ACL、IJCAI和SIGIR是自然语言处理、人工智能和信息检索领域的顶级国际学术会议。AIS顶级会议论文报告会是由中国中文信息学会青年工作委员会主办的系列学术活动,自2017年起已连续...

2020-05-21 17:00:00 2979

转载 如何用python制作动态二维码,提升表白成功率?

来源:凹凸数据本文约1000字,建议阅读5分钟。本文教你用python制作动态二维码,助你表白成功!关注数据派THU(DatapiTHU)后台回复“20200520”获取完整代码和gif...

2020-05-20 17:00:00 882

转载 量子计算的人才、软件和硬件:解开你对量子的困惑

来源:AI TIME 论道本文约2300字,建议阅读10分钟量子计算到底是什么?它和量子力学有什么关系?它的发展历程怎么样?它能否取代现有的电子计算机?近几年,量子计算屡屡登上媒体的头条...

2020-05-20 17:00:00 1105

原创 独家 | 数据转换:标准化vs 归一化(附代码&链接)

作者:Clare Liu, 英国金融科技数据科学家翻译:林鹤冲校对:王紫岳本文约2300字,建议阅读10分钟本文将解释数据转换中常见的特征缩放方法:“标准化”和“归一化”的不同之处,并举...

2020-05-19 17:00:00 762

转载 也有个自由职业梦?日本码农辞职一年后:独立工程师太难了

来源:大数据文摘本文长度为5700字,建议阅读9分钟本文为你介绍自由AI工程师的心得,不依赖企业名声,真的能靠自己打出一片天地吗?如今,越来越多的人选择成为自由职业者,但是在AI行业,自...

2020-05-19 17:00:00 964

转载 北京小伙用AI修复100年前的京城老视频爆火网络,作者:7天完成,颜色还有不足...

来源:大数据文摘本文长度为4300字,建议阅读8分钟。下次给AI看看清宫剧学习。标签:机器学习昨天,一个“修复老北京街道”的视频刷屏全网。一段由加拿大摄影师在100年前的北京被AI修复后...

2020-05-18 17:00:00 1468

原创 原创 | 脑机接口不断迎来重大突破,“思想钢印”还会远吗?

一、脑机接口发展正在走向高潮上个月,脑机接口领域再次迎来重大突破:使瘫痪者成功恢复运动能力,触觉准确率高达 90%。4 月 23 日,《细胞》(Cell)杂志刊登了一篇来自美国俄亥俄...

2020-05-18 17:00:00 2308

转载 数据缺失、混乱、重复怎么办?最全数据清洗指南

作者:机器之心本文约5000字,建议阅读10分钟本文为你介绍如何在 Python 中执行数据的分步清洗。标签:数据处理要获得优秀的模型,首先需要清洗数据。在拟合机器学习或统计模型之前,我...

2020-05-17 17:00:00 1359

转载 数据安全最佳实践案例库建设项目正式启动

关注数据派THU(DatapiTHU)后台回复“20200516”,获取数据安全最佳实践案例库案例征集表。 ...

2020-05-16 17:00:00 401

原创 独家 | SVP:一种用于深度学习的高效数据选择方法

作者:Cody Coleman, Peter Bailis, and Matei Zaharia翻译:杨毅远校对:王琦本文长度为1800字,建议阅读7分钟本文为你介绍SVP方法如何在保证...

2020-05-15 17:00:00 1207

转载 一个简单的更改让PyTorch读取表格数据的速度提高20倍:可大大加快深度学习训练的速度...

来源:DeepHub IMBA本文约3000字,建议阅读5分钟我在PyTorch中对表格的数据加载器进行的简单更改如何将训练速度提高了20倍以上,而循环没有任何变化!深度学习:需要速度在...

2020-05-14 17:00:00 839

原创 原创 | 一文读懂模型的可解释性(附代码&链接)

作者:林夕本文长度为10000字,建议阅读10+分钟对于信任和管理我们的人工智能“合作伙伴”,可解释AI则至关重要。目录1.1 可解释的重要性1.2 可解释性的范围1.2.1. 算法透明...

2020-05-14 17:00:00 4962 2

转载 设备状态监测及故障预警,你了解多少?

来源:工业检测本文约2800字,建议阅读5分钟。本文为你介绍设备状态监测及故障预警。随着当代工业及科学技术的发展,现代设备发展的一个总体趋势是向复杂化、智能化和自动化方向发展,在役设备运...

2020-05-13 17:00:00 9334 2

转载 50位全球专家畅谈人工智能治理进程——结伴前行,合作共赢(附下载)

来源:清华大学战略与安全研究中心本文约600字,建议阅读7分钟本文为你带来《全球人工智能治理年度观察》。上海市科学学研究所联合国际合作伙伴,以“2019年度全球人工智能治理进展”为主题,...

2020-05-12 17:00:00 323

原创 独家 | 强化学习必知二要素——计算效率和样本效率

作者:Kevin Vu,Exxact公司翻译:陈之炎校对:吴振东本文约4800字,建议阅读10分钟在强化学习模型中尝试不同的策略对于开发最佳应用程序至关重要,然而,资源的占地可能会对系统...

2020-05-12 17:00:00 1415

转载 2020年全国信息安全标准化技术委员会大数据安全标准特别工作组全体会议即将召开...

全国信息安全标准化技术委员会(TC260)(以下简称:委员会)大数据安全标准特别工作组(SWG-BDS)2020年首次全体会议即将在5月13-15日召开,会议由清华大学组织开展,工作组3...

2020-05-11 19:07:48 2040

转载 数据=新生产要素,数据安全之墙如何建?

来源:数据观本文约7300字,建议阅读10分钟将数据作为生产要素,在社会上的探索已经开展多年了。中共中央、国务院2020年3月30日公开发布了《关于构建更加完善的要素市场化配置体制机制的...

2020-05-10 17:00:00 1737

转载 机器学习丨15个最流行的GitHub机器学习项目

来源:数据Seminar本文约3800字,建议阅读7分钟。本文列出了 2017 年 GitHub 平台上最为热门的知识库,其中包含了学习资料与工具。GitHub 是计算机科学领域最为活跃...

2020-05-09 17:00:00 960

转载 教你动手推导Self-Attention!(附代码)

作者:机器学习算法工程师本文约4200字,建议阅读10分钟本篇文章的主要内容是引导您完成Self-Attention模块中涉及的数学运算。标签:深度学习前言译者: 在 medium 看到...

2020-05-09 17:00:00 3077 2

转载 一位中国博士把整个 CNN 都给可视化了,可交互有细节,每次卷积 ReLU 池化都清清楚楚...

本文经AI新媒体量子位(公众号ID:qbitai)授权转载,转载请联系出处本文约900字,建议阅读5分钟。本文带你一张图看懂CNN。标签:人工智能技术CNN是什么?美国有线电视新闻网吗?...

2020-05-08 17:00:00 333

原创 独家 | 简单三步实现Python脚本超参数调优(附代码)

作者:Jakub Czakon, Neptune.ai翻译:陈之炎校对:和中华本文约1500字,建议阅读5分钟。Python机器学习模型建立起来之后,如何对它的性能进行优化?按照本指南中...

2020-05-08 17:00:00 1272

转载 刷B站的年轻人,到底在刷什么?

来源:DT财经本文约1200字,建议阅读5分钟本文为大家介绍了年轻的B站用户到底都在看什么、喜欢什么,奉上一份当代年轻人精神生活指南。2019年5月时,我们曾写过一篇《我们研究了B站,发...

2020-05-07 17:00:00 1091

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除