自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据派THU

发布清华大学数据科学相关科研动态、教学成果及线下活动

转载 这场大数据+AI Meetup,一次性安排了大数据当下热门话题

近年来,随着工业界多年的努力以及新兴技术的不断涌现,数据规模庞大的问题已逐步得到解决,而数据处理的时效性、数据价值的挖掘正成为企业及开发者面临的新的巨大挑战。也因此,大数据计算引擎、AI...

2020-05-29 17:00:00 5 0

转载 五位工程师亲述:AI技术人才如何快速成长?

来源:AI前线本文长度为12000字,建议阅读10分钟本文与你分享AI技术人才的真实成长经历。标签:人工智能前言参考塞缪尔. 约翰逊(18 世纪英国文学评论家、诗人,著有《英语大辞典》、...

2020-05-29 17:00:00 0

原创 原创 | 安全生产事故如何防患于未然?监测与预警平台为安全和效益保驾护航...

一、安全事故无法杜绝,安全技术发展永无止境今年4月21日,江苏连云港一家生产碳化硅的企业车间发生火灾和爆炸,一时间,互联网上一片谴责痛惜之声,“连云港化工厂爆炸”成为网络热点事件,一度排...

2020-05-28 17:27:20 220 0

转载 强者愈强!疫情拉大“数据资产”贫富差距,顶级公司数据建设靠什么

5月12日,谷歌子公司Waymo宣布获得7.5亿美元的额外投资,将无人驾驶汽车商业化。两个月内,Waymo的筹款额已经达到了30亿美元。阿里云计算收入同比增长58%,新零售平台在疫情影响...

2020-05-27 17:00:00 22 0

原创 独家 | 机器学习中的四种分类任务(附代码)

作者:Jason Brownlee翻译:陈丹校对:杨毅远全文约4400字,建议阅读18分钟本文为大家介绍了机器学习中常见的四种分类任务。分别是二分类、多类别分类、多标签分类、不平衡分类,...

2020-05-27 17:00:00 52 0

原创 独家 | 数据科学入门指南:新手如何步入数据科学领域?

作者:Sangeet Aggarwal翻译:陈之炎校对:冯羽本文长度为2900字,建议阅读6分钟本文将带大家讨论如何从零开始数据科学之旅。标签:数据科学,机器学习数据科学,据说是本世纪...

2020-05-26 17:00:00 68 0

转载 收藏 | Google 发布官方中文版机器学习术语表

来源:机器学习算法与Python学习本文长度为16000字,建议阅读10+分钟本文与你分享一般的Machine Learning术语和 TensorFlow 专用术语的定义。标签:机器学...

2020-05-26 17:00:00 41 0

原创 原创|一文读懂主成分分析(PCA)

作者:贾恩东本文长度为2500字,建议阅读7分钟这篇文章主要带大家入门PCA,逐渐理解PCA最原始的概念和设计思路,以及简单的实现原理。主成分分析,即Principle Componen...

2020-05-25 17:00:00 151 0

转载 国内NLP竞赛平台一览(附平台连接)

来源:NLP有品本文约700字,建议阅读10分钟本文为大家分享国内NLP竞赛平台。标签:自然语言处理“白嫖数据的圣地,NLP技能的训练场”,当你觉得学好了NLP技能想练手却苦于没有数据...

2020-05-25 17:00:00 96 0

转载 百度语义解析 ( Text-to-SQL ) 技术研究及应用

来源:DataFunTalk本文长度为6500字,建议阅读10+分钟本文介绍自然语言问题转成数据库可操作的SQL查询语句的应用。[ 导读 ]语义解析( Semantic Parsing...

2020-05-24 17:00:00 221 0

转载 卷积神经网络中10大拍案叫绝的操作!

来源:AI蜗牛车本文约4000字,建议阅读8分钟。本文我们从变革性工作中探讨日后的CNN变革方向。标签:人工智能技术从2012年的AlexNet发展至今,科学家们发明出各种各样的CNN模...

2020-05-24 17:00:00 125 0

转载 送你一份概率图模型笔记

来源:NewBeeNLP本文长度为2700字,建议阅读6分钟本文为你分享一份概率图模型学习笔记,一起交流。写在前面其实接触概率图模型也有一段时间了,从开始入坑NLP起,也陆陆续续看了很多...

2020-05-23 19:23:00 182 0

原创 独家 | 浅析机器学习中的自由度

作者:Jason Browniee翻译:张若楠校对:林鹤冲本文长度为2800字,建议阅读8分钟本文介绍了自由度的概念,以及如何判断统计学模型和机器学习模型中的自由度。标签:数据处理自由度...

2020-05-22 17:00:00 149 0

转载 数据安全最佳实践案例库建设项目案例征集

2020年5月15日,由清华大学大数据研究中心和大数据系统软件国家工程实验室联合发起的数据安全最佳实践案例库建设项目正式启动。清华大学大数据研究中心和大数据系统软件国家工程实验室作为我国...

2020-05-21 17:00:00 55 0

转载 开启注册丨ACL-IJCAI-SIGIR顶级会议论文报告会(AIS 2020)

ACL、IJCAI和SIGIR是自然语言处理、人工智能和信息检索领域的顶级国际学术会议。AIS顶级会议论文报告会是由中国中文信息学会青年工作委员会主办的系列学术活动,自2017年起已连续...

2020-05-21 17:00:00 353 0

转载 如何用python制作动态二维码,提升表白成功率?

来源:凹凸数据本文约1000字,建议阅读5分钟。本文教你用python制作动态二维码,助你表白成功!关注数据派THU(DatapiTHU)后台回复“20200520”获取完整代码和gif...

2020-05-20 17:00:00 95 0

转载 量子计算的人才、软件和硬件:解开你对量子的困惑

来源:AI TIME 论道本文约2300字,建议阅读10分钟量子计算到底是什么?它和量子力学有什么关系?它的发展历程怎么样?它能否取代现有的电子计算机?近几年,量子计算屡屡登上媒体的头条...

2020-05-20 17:00:00 124 0

转载 也有个自由职业梦?日本码农辞职一年后:独立工程师太难了

来源:大数据文摘本文长度为5700字,建议阅读9分钟本文为你介绍自由AI工程师的心得,不依赖企业名声,真的能靠自己打出一片天地吗?如今,越来越多的人选择成为自由职业者,但是在AI行业,自...

2020-05-19 17:00:00 134 0

原创 独家 | 数据转换:标准化vs 归一化(附代码&链接)

作者:Clare Liu, 英国金融科技数据科学家翻译:林鹤冲校对:王紫岳本文约2300字,建议阅读10分钟本文将解释数据转换中常见的特征缩放方法:“标准化”和“归一化”的不同之处,并举...

2020-05-19 17:00:00 74 0

转载 北京小伙用AI修复100年前的京城老视频爆火网络,作者:7天完成,颜色还有不足...

来源:大数据文摘本文长度为4300字,建议阅读8分钟。下次给AI看看清宫剧学习。标签:机器学习昨天,一个“修复老北京街道”的视频刷屏全网。一段由加拿大摄影师在100年前的北京被AI修复后...

2020-05-18 17:00:00 103 0

原创 原创 | 脑机接口不断迎来重大突破,“思想钢印”还会远吗?

一、脑机接口发展正在走向高潮上个月,脑机接口领域再次迎来重大突破:使瘫痪者成功恢复运动能力,触觉准确率高达 90%。4 月 23 日,《细胞》(Cell)杂志刊登了一篇来自美国俄亥俄...

2020-05-18 17:00:00 268 0

转载 数据缺失、混乱、重复怎么办?最全数据清洗指南

作者:机器之心本文约5000字,建议阅读10分钟本文为你介绍如何在 Python 中执行数据的分步清洗。标签:数据处理要获得优秀的模型,首先需要清洗数据。在拟合机器学习或统计模型之前,我...

2020-05-17 17:00:00 203 0

转载 数据安全最佳实践案例库建设项目正式启动

关注数据派THU(DatapiTHU)后台回复“20200516”,获取数据安全最佳实践案例库案例征集表。 ...

2020-05-16 17:00:00 78 0

原创 独家 | SVP:一种用于深度学习的高效数据选择方法

作者:Cody Coleman, Peter Bailis, and Matei Zaharia翻译:杨毅远校对:王琦本文长度为1800字,建议阅读7分钟本文为你介绍SVP方法如何在保证...

2020-05-15 17:00:00 307 0

转载 一个简单的更改让PyTorch读取表格数据的速度提高20倍:可大大加快深度学习训练的速度...

来源:DeepHub IMBA本文约3000字,建议阅读5分钟我在PyTorch中对表格的数据加载器进行的简单更改如何将训练速度提高了20倍以上,而循环没有任何变化!深度学习:需要速度在...

2020-05-14 17:00:00 248 0

原创 原创 | 一文读懂模型的可解释性(附代码&链接)

作者:林夕本文长度为10000字,建议阅读10+分钟对于信任和管理我们的人工智能“合作伙伴”,可解释AI则至关重要。目录1.1 可解释的重要性1.2 可解释性的范围1.2.1. 算法透明...

2020-05-14 17:00:00 594 0

转载 设备状态监测及故障预警,你了解多少?

来源:工业检测本文约2800字,建议阅读5分钟。本文为你介绍设备状态监测及故障预警。随着当代工业及科学技术的发展,现代设备发展的一个总体趋势是向复杂化、智能化和自动化方向发展,在役设备运...

2020-05-13 17:00:00 597 0

转载 数据纪实|颜强:疫情下的中国制造

来源:硬科技城邦作者:Olivia Meng指导单位:清华大学学生大数据研究协会本文约6300字,建议阅读11分钟本文为大家介绍关于疫情下的中国制造。面对一个全世界受到生命威胁的传染疾病...

2020-05-13 17:00:00 224 0

转载 50位全球专家畅谈人工智能治理进程——结伴前行,合作共赢(附下载)

来源:清华大学战略与安全研究中心本文约600字,建议阅读7分钟本文为你带来《全球人工智能治理年度观察》。上海市科学学研究所联合国际合作伙伴,以“2019年度全球人工智能治理进展”为主题,...

2020-05-12 17:00:00 58 0

原创 独家 | 强化学习必知二要素——计算效率和样本效率

作者:Kevin Vu,Exxact公司翻译:陈之炎校对:吴振东本文约4800字,建议阅读10分钟在强化学习模型中尝试不同的策略对于开发最佳应用程序至关重要,然而,资源的占地可能会对系统...

2020-05-12 17:00:00 328 0

转载 2020年全国信息安全标准化技术委员会大数据安全标准特别工作组全体会议即将召开...

全国信息安全标准化技术委员会(TC260)(以下简称:委员会)大数据安全标准特别工作组(SWG-BDS)2020年首次全体会议即将在5月13-15日召开,会议由清华大学组织开展,工作组3...

2020-05-11 19:07:48 180 0

转载 数据=新生产要素,数据安全之墙如何建?

来源:数据观本文约7300字,建议阅读10分钟将数据作为生产要素,在社会上的探索已经开展多年了。中共中央、国务院2020年3月30日公开发布了《关于构建更加完善的要素市场化配置体制机制的...

2020-05-10 17:00:00 356 0

转载 教你动手推导Self-Attention!(附代码)

作者:机器学习算法工程师本文约4200字,建议阅读10分钟本篇文章的主要内容是引导您完成Self-Attention模块中涉及的数学运算。标签:深度学习前言译者: 在 medium 看到...

2020-05-09 17:00:00 167 0

转载 机器学习丨15个最流行的GitHub机器学习项目

来源:数据Seminar本文约3800字,建议阅读7分钟。本文列出了 2017 年 GitHub 平台上最为热门的知识库,其中包含了学习资料与工具。GitHub 是计算机科学领域最为活跃...

2020-05-09 17:00:00 142 0

原创 独家 | 简单三步实现Python脚本超参数调优(附代码)

作者:Jakub Czakon, Neptune.ai翻译:陈之炎校对:和中华本文约1500字,建议阅读5分钟。Python机器学习模型建立起来之后,如何对它的性能进行优化?按照本指南中...

2020-05-08 17:00:00 71 0

转载 一位中国博士把整个 CNN 都给可视化了,可交互有细节,每次卷积 ReLU 池化都清清楚楚...

本文经AI新媒体量子位(公众号ID:qbitai)授权转载,转载请联系出处本文约900字,建议阅读5分钟。本文带你一张图看懂CNN。标签:人工智能技术CNN是什么?美国有线电视新闻网吗?...

2020-05-08 17:00:00 79 0

转载 刷B站的年轻人,到底在刷什么?

来源:DT财经本文约1200字,建议阅读5分钟本文为大家介绍了年轻的B站用户到底都在看什么、喜欢什么,奉上一份当代年轻人精神生活指南。2019年5月时,我们曾写过一篇《我们研究了B站,发...

2020-05-07 17:00:00 264 0

原创 独家 | 教你使用torchlayers 来构建PyTorch 模型(附链接)

作者:Matthew Mayo翻译:王琦校对:和中华本文约1200字,建议阅读5分钟本文介绍了torchlayers。torchlayers 旨在做Keras为TensorFlow所做的...

2020-05-06 17:00:00 120 0

转载 如何在远程会议的时候静音吃薯片?微软团队用AI去除视频噪声

来源:大数据文摘本文约2200字,建议阅读5分钟AI将实时消除背景噪音,让你只在通话中听到语音。那它究竟是怎么做到的呢?标签:人工智能之前Microsoft宣布,其与Slack,Face...

2020-05-06 17:00:00 291 0

转载 洞悉2020年数据团队建设,我们和清华、领英一起搞了个大事情,你也可以参与!...

我的公司是否需要独立的数据团队?我该何时、怎么样建设自己的数据团队?数据团队的价值如何衡量?疫情之下,数据团队又受到哪些影响?加入我们,一起透析数据团队建设全景!数据驱动时代,数据团队作...

2020-05-04 17:00:00 93 0

提示
确定要删除当前文章?
取消 删除