自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据派THU

发布清华大学数据科学相关科研动态、教学成果及线下活动

  • 博客(41)
  • 收藏
  • 关注

转载 最新计算机技能需求排名出炉:Python仅排第三,第一你猜得到吗?(附链接)...

来源:机器之心本文约1700字,建议阅读5分钟。本文带你了解9102年,哪一门计算机技能最当红?除了编程语言之外,要想找一份计算机相关的工作,还需要很多其他方面的技能。最近,来自美国求职...

2019-11-28 17:00:00 215

原创 独家 | 年度盘点!必看AI顶会论文、Github高星项目大合集(附链接)

目前,国外计算机界评价学术水平主要是看在顶级学术会议上发表的论文,特别是在机器学习、计算机视觉和人工智能领域,顶级会议才是王道。本期我们盘点了2019年人工智能领域的顶会...

2019-11-27 17:00:00 1183

转载 清华自然语言处理科学家孙茂松:深度学习碰壁之后,我们还能做什么?

来源:AI前线本文约5300字,建议阅读11分钟。清华自然语言处理科学家孙茂松为你解答深度学习。[ 导读 ]10 月 31 日,北京创建全球人工智能学术和创新最优生态的标...

2019-11-26 17:00:00 544

原创 独家 | 浅谈强化学习原理(附代码&链接)

作者:Michel Kana翻译:王琦校对:王雨桐本文约4900字,建议阅读15分钟。本文介绍了强化学习的基本原理,并通过代码实例来讲解如何找到最优策略。Google在2...

2019-11-25 17:00:00 692

转载 近期活动盘点:统计学概论和医疗临床大数据分析讲座、24小时创新挑战:数字时代的人类健康与福祉...

想知道近期有什么最新活动?大数点为你整理的近期活动信息在此:统计学概论和医疗临床大数据分析讲座2019年11月27日这期清华大数据“技术·前沿”系列讲座,我们邀请到加拿大约克大学数学统计系终身教授王晓刚老师来做分享。王晓刚老师讲从以下两个方向为大家做分享报告:1、统计学是应用数学的一个分支。现在已经发展成为一个独立的学科。统计学通过科学的收集数据,进行量化分析和总结,最终建立有效的预测模型。在国外...

2019-11-24 17:00:00 248

转载 斯坦福&Google | 面向机器人的机器学习(附63页PPT下载)

来源:专知本文多图,建议阅读9分钟附“机器人技术”的论文知识资料下载~[ 导读 ]机器人在社会上有很多应用,比如今年双十一我们明显感到快递变得更快了!这背后就有分拣机器人...

2019-11-24 17:00:00 402

转载 数据蒋堂 | 大数据技术的4个E

作者:蒋步星来源:数据蒋堂本文共1100字,建议阅读8分钟。本文将大数据特点总结成4个E,可作为选择大数据技术解决方案的参考。大数据的4个V说法在业界已经尽人皆知,这是指的大数据本身的特征。现在我们来考察一下用于处理大数据的技术应该具有的特性。为方便记忆,类似4个V,我们把这些特性总结成4个E,用户在选择大数据技术解决方案时可作为参考。Easy大数据技术要足够简单易用这个E很容易理解。要进行大数...

2019-11-23 17:00:00 236

转载 102页PPT,DeepMind强化学习最新进展,含图文、公式和代码

来源:专知本文多图,建议阅读9分钟本文提供涵盖了强化学习RL基础概念、策略梯度、动态规划以及D4PG、R2D3等RL算法的资源。[ 导读 ]在DeepMing任职的Nan...

2019-11-22 17:00:00 1783

转载 报名丨24小时创新挑战:数字时代的人类健康与福祉

期中周刚过你是否在日复一日的挑灯夜战中担心稀疏的头发和后移的发际线忧虑疼痛的关节和不充足的睡眠打开手机 连接世界你是否在信息洪流中紧皱眉头感同身受于当代人的健康与幸福焦虑...

2019-11-21 17:00:00 563

原创 独家 | 基于生成对抗网络(GAN)的人脸变形(附链接)

作者:Rudra Raina翻译:张一豪校对:吴金笛本文约2100字,建议阅读10分钟。本文详细介绍了生成对抗网络(GAN)的知识,并用其变换人脸,并探寻如何利用Styl...

2019-11-21 17:00:00 2812

转载 报名 | 统计学概论和医疗临床大数据分析讲座

本期清华大数据“技术·前沿”系列讲座,我们邀请到加拿大约克大学数学统计系终身教授王晓刚老师来做分享。王晓刚老师讲从以下两个方向为大家做分享报告:1、统计学是应用数学的一个...

2019-11-20 17:00:00 351

原创 独家 | 一文读懂概率论学习:贝叶斯理论(附链接)

作者:Jaime Zornoza翻译:李 洁校对:郑 滋本文长度约为3400字,建议阅读10分钟本文为大家详细介绍了概念学习中常见的贝叶斯理论。通过一个简单示例,了解概率...

2019-11-20 17:00:00 841

原创 独家|图说Pandas中旋转和重塑函数

作者:Jay Alammar翻译:张振东本文多图例,建议阅读5分钟。本文通过图例的方式,举例说明了pandas中旋转(pivot)和重塑(reshape)函数的实现方式。...

2019-11-19 17:00:00 295

原创 独家 | 一文盘点AutoML 库(附PPT等链接)

作者:Xu LIANG翻译:王雨桐校对:王威力本文长度约为1300字,建议阅读5分钟本文是Masashi Shibata针对AutoML演讲中的摘要。自动化程度Jeff ...

2019-11-18 21:07:00 419

转载 数据蒋堂 | 大清单报表的打印?

作者:蒋步星来源:数据蒋堂本文共900字,建议阅读5分钟。报表打印也需要做一个缓存机制吗?那么,打印是不是也要像呈现那样做一个缓存机制呢?没有这个必要。打印和浏览不同,一般是从头到尾过一遍就行了,过程中没有翻页的需求。这样,只要流式读入数据逐步生成打印页就可以了,不会发生内存溢出的问题。但这个做法仍然比较麻烦,特别是现代浏览器加强了安全控制,applet等插件经常被禁用,打印功能常常不能直接由报表...

2019-11-17 07:30:00 196

转载 近期活动盘点:高级机器学习训练营、基于神经网络的代码自动生成” “开放学术图谱”、西山金融科技产业创新论坛...

想知道近期有什么最新活动?大数点为你整理的近期活动信息在此:清华唐杰教授授课 高级机器学习训练营我们都知道随着数据复杂度的不断提高,经典机器学习算法已经很难满足实际需求,当前,针对复杂数据对象、复杂任务和模拟人脑思维过程的机器学习理论逐渐成为数据挖掘和智能信息处理的主流。掌握并熟练应用这些新型机器学学习理论和相关算法成为AI从业者必备的技能之一。对于想在人工智能领域有所突破,成为高级AI人才的同学...

2019-11-17 07:30:00 945

转载 知识图谱从哪里来:实体关系抽取的现状与未来

来源:知乎 NLP日知录作者:韩旭、高天宇、刘知远本文约8750字,建议阅读10分钟。本文作者总结了对实体关系抽取现状、挑战和未来发展方向的认识。最近几年深度学习引发的人...

2019-11-17 07:30:00 1104

转载 报名丨西山金融科技产业创新论坛邀您参会

为推动我国金融科技行业的创新与发展,打造更具活力的科技金融创新生态,西山金融科技产业创新论坛拟于2019年11月23日在北京举行。届时将有政府领导,监管机构领导,中国科技...

2019-11-16 17:00:00 222

转载 干货 | 吴恩达亲自为这份深度学习专项课程精炼图笔记点了赞!(附下载)

来源:机器之心、AI有道本文约7500字,建议阅读10+分钟。本文整理了深度学习基础、卷积网络和循环网络的学习笔记,附下载哦~[ 导读]吴恩达在推特上展示了一份由 Te...

2019-11-16 17:00:00 314

原创 研究学者、医师与产业投资者齐聚一堂,将碰撞出何种火花?

2019年11月14日,由清华大学技术转移研究院和数据科学研究院联合举办的第二期“医工结合”高峰论坛于清华大学主楼接待厅拉开帷幕。此次论坛以“科技驱动、正向创新”为主题,...

2019-11-15 17:50:23 436

原创 独家 | 使用高斯混合模型,让聚类更好更精确(附数据&代码&学习资源)

作者:AISHWARYA SINGH翻译:张玲校对:张一豪本文约3500字,建议阅读10+分钟。本文简单介绍聚类的基础知识,包括快速回顾K-means算法,然后深入研究高...

2019-11-14 22:31:58 1844 1

转载 GitHub超3k星!从Python代码到APP只需要一个小工具~

来源:机器之心本文约2600字,建议阅读7分钟。本文带你了解这款工具,在你写 Python 代码的时候,实时更新你的应用。机器学习开发者想要打造一款 App 有多难?事实...

2019-11-13 17:00:00 238

转载 清北顶会学霸:“表情”与“认知”引发的科学思辨 | 清华AI Time PHD

来源:AI TIME 论道‍本文约2100字,建议阅读5分钟。北京大学博士生陈震鹏和清华大学博士生丁铭两位年轻的学霸,分享他们的人工智能科研道路上的思考与成果。伯格森言:...

2019-11-13 17:00:00 701

原创 融合与发展:数据科学研究院RONG研究员首次工作汇报会圆满结束

2019年11月08日上午,数据科学研究院(以下简称“数据院”)RONG研究员工作汇报会首次会议于双清大厦成功举办。数据院院长俞士纶、执行副院长韩亦舜与来自于不同领域的五...

2019-11-12 16:07:39 390

转载 2019前沿信息科技创新论坛成功举办

11月9日,2019前沿信息科技创新论坛在清华大学FIT楼成功举办。本次大会由清华-青岛数据科学研究院(以下简称:数据院)与中国云体系产业创新战略联盟主办,Ever链动承...

2019-11-12 16:07:39 956

原创 独家 | 教你用不到30行的Keras代码编写第一个神经网络(附代码&教程)

翻译:陈丹校对:和中华本文长度为3000字,建议阅读5分钟本文为大家介绍了如何使用Keras来快速实现一个神经网络。回忆起我第一次接触人工智能的时候,我清楚地记得有些概念...

2019-11-11 17:00:00 293

转载 GitHub超3万星最全面试题库:计算机面试题一网打尽

来源:新智元本文为多资源,建议阅读5分钟。本文为你推荐最全面的面试题库GitHub:Awesome Interviews。[ 导读 ]刷题是非常不错的提高面试成功率的手段...

2019-11-11 17:00:00 595

转载 近期活动盘点:首期AI Time PhD:清北师兄分享前沿研究成果、“科技驱动,正向创新”医工结合高峰论坛...

想知道近期有什么最新活动?大数点为你整理的近期活动信息在此:首期AI Time PhD2019年11月11日AI Time PhD第一期我们邀请了北京大学的陈震鹏博士,清华大学的丁铭博士,想了解二位高颜值的超级学霸为我们带来何种精彩分享,来现场与大家一起探索科学的本质!【时间】2019年11月11日15:00-17:00【地点】海淀区中关村东路搜狐大厦二楼1911【主办单位】AI TIME【公益...

2019-11-10 17:00:00 291

转载 技术安全与伦理的较量:论道AI的能与不能 | AI Time

来源:AI Time 论道本文约3700字,建议阅读9分钟。与顶尖学者一同畅想AI的未来可能落地。在电影《超能陆战队》中,医疗机器人“大白”只需一次简单快速的扫描,就能检...

2019-11-10 17:00:00 1240

转载 数据蒋堂 | 大清单报表应当怎么做?

作者:蒋步星来源:数据蒋堂本文共1200字,建议阅读9分钟。在数据查询时,有时会碰到数据量很大的清单报表。在数据查询时,有时会碰到数据量很大的清单报表。用户输入的查询条件很宽泛,可能会从数据库中查出几百上千万行甚至过亿的记录。如果等着把这些记录全部检索出来再生成报表呈现,那需要很长时间,用户体验恶劣;而且报表一般采用内存运算机制,大多数情况下也装不下这么多数据。所以,我们一般都是使用分页呈现的方式...

2019-11-09 17:00:00 216

转载 90后技术宅研发Magi一夜爆红,新一代知识化结构搜索新时代来了?

来源:授权自AI科技大本营(ID:rgznai100)本文约3300字,建议阅读9分钟。Magi突然蹿红,为什么?11 月 7 日,微信群里突然炸了,大家似乎都在讨论一个...

2019-11-09 17:00:00 471

原创 传道、授业、解惑:俞士纶院长参加数据科学研究院第五届“院长接待日”

俞士纶院长正在耐心为学生解答疑问清华大学学生大数据研究协会的联席会长凡航主持了本次院长接待日活动,并对大数据协会目前的状况和最近的精彩活动进行了介绍。大数据协会今年招收会...

2019-11-09 17:00:00 585

转载 快讯 | 清华-哈佛外科论坛:未来可期的最新医疗科技动向

本文2066字,建议阅读6分钟。本文介绍了清华-哈佛外科论坛上所透露出的最新医疗科技动向。大会开幕式在一曲来自青海牧区民族艺术家的歌舞表演中拉开序幕,以致敬响应党中央和国...

2019-11-07 17:41:51 239

原创 再不剁手来不及了~送上这份技术宅双十一推荐清单!

一年一度的双十一剁手节即将来临,每年的这一天,男女老幼整装待发,手握计算器,算尽各种优惠填满购物车。虽说剁手是女人的天性,可现如今,精致的猪猪男孩,剁起手来也是毫不含糊~...

2019-11-07 17:41:51 1251

转载 福利 | 50张第四届UBDC全域大数据峰会赠票大放送!

文末有福利哦~现代运营、营销人需要更聪明的方式来获取用户,从增长黑客、公私域流量、到智能运营......概念层出不穷,知行合一,才可成功。2019年11月19日,友盟+将...

2019-11-06 17:00:00 260

转载 面部识别必看!5篇顶级论文了解如何实现人脸反欺诈、跨姿势识别等(附链接)...

来源:新智元本文约1800字,建议阅读5分钟。本文筛选了5篇非常重量级的有关人脸识别的机器学习论文,并提炼出论文最关键的信息。[ 导读 ]面部识别是计算机视觉中最大的研究...

2019-11-06 17:00:00 1167

转载 报名 | 首期AI Time PhD:听清北师兄分享前沿研究成果!

科研道路上,让优秀的师兄师姐与优秀的你一同前进!AI Time PhD第一期我们邀请了北京大学的陈震鹏博士,清华大学的丁铭博士,想了解二位高颜值的超级学霸为我们带来何种精...

2019-11-05 17:00:00 386

原创 独家 | 手把手教你做数据挖掘 !(附教程&数据源)

作者:宋莹本文长度为10427字,建议阅读20+分钟本文为你介绍数据挖掘的知识及应用。引言最近笔者学到了一个新词,叫做“认知折叠”。就是将复杂的事物包装成最简单的样子,让...

2019-11-05 17:00:00 3289 1

转载 数据蒋堂 | 这个产品能支持多大数据量?

作者:蒋步星来源:数据蒋堂本文共500字,建议阅读5分钟。似乎是支持数据量越大,产品就越厉害。经常有用户会问这个问题,你家的产品能处理多大数据量?似乎是这个值越大产品就越牛。这个问题,其实没多大意义。能处理多大的数据量,还有个很关键的因素是期望的响应时间,在脱离这个因素单纯谈大数据产品的数据处理量,就不知道怎么回答了。考虑只有单台机器的简单情况。如果是希望秒级响应的OLAP式汇总,那么GB级都是挺...

2019-11-03 19:00:00 125

转载 近期活动盘点:清华严飞大数据探寻中国文脉讲座、2019前沿信息科技创新论坛...

想知道近期有什么最新活动?大数点为你整理的近期活动信息在此:清华严飞:用大数据探寻中国文脉讲座2019年11月07日文化脉络(Cultural Context)从狭义上解释为文学中的“上下文”,更广泛的意义上,引申为文化现象在时间或空间上的关联与发展,也即文脉。中国是一个历史积淀和文化底蕴极为深厚的大国,国家文脉在全球文化格局中的地位和变迁,是中国软实力和中国崛起的重要组成部分。也因此,探寻中国...

2019-11-03 19:00:00 288

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除