数据派THU

发布清华大学数据科学相关科研动态、教学成果及线下活动

支持实践教学:清华大数据能力提升项目举办CIKM AnalytiCup2017冠军团队经验分享会

2017年11月29日,清华-青岛数据科学研究院(以下简称:数据院)报告厅举办了一场赛事经验分享讲座。数据院邀请到数据派研究部成员、清华大学工程力学系博士生姚易辰和清华热能系博士生李中杰前来分享他们在CIKM AnalytiCup 2017比赛上的夺冠参赛经验。此次讲座属于清华大数据能力提升项目的...

2017-12-01 00:00:00

阅读数:127

评论数:0

IBM苏中:怎样利用深度学习、增强学习等方法提高信息处理效率

伴随着认知计算时代的到来,如何将我们计算机的信息处理能力与人类的认知能力相结合,从而提高我们的信息处理效率,是我们在目前所要思考的问题。本期清华大数据“技术·前沿”系列讲座我们邀请到IBM研究院研究总监、大数据及计算研究方向首席数据科学家苏中为大家带来题为《从深蓝到AlphaGo,从大数据到认知商...

2017-12-01 00:00:00

阅读数:94

评论数:0

300万知乎多标签文本分类任务经验分享(附源码)

来源:大数据挖掘DT数据分析 本文长度为4600字,建议阅读6分钟 本文为你分享知乎看山杯冠军团队参赛经验。 后台回复回复关键词“PT”即可获取源码(PyTorch实现)github地址。 七月,酷暑难耐,认识的几位同学参加知乎看山杯,均取得不错的排名。当时天池...

2017-11-30 00:00:00

阅读数:1353

评论数:0

数据揭秘清华研究生日常!47%单身,50.7%从未打过游戏...

清华研究生在园子里的生活如何?他们怎么看待学业?日常习惯如何?有怎样的就业预期?都脱单了吗? 今天,研读间带你揭秘清华研究生的那些事儿。 第一编 基本信息 1.  男女比例 男女比例接近2比1,看来清华的研究生群体,也是「僧多肉少」。 ——莫名...

2017-11-29 00:00:00

阅读数:385

评论数:0

送你6份最新开源代码!含NLP、ML、计算机视觉方向(附代码&论文)

来源:PaperWeekly 本文长度为636字,建议阅读3分钟 本文为你分享6份最新的开源代码,包括自然语言处理、计算机视觉和机器学习3个方面。 自然语言处理  1 DuReader: a Chinese Machine Reading Comprehe...

2017-11-29 00:00:00

阅读数:181

评论数:0

通知 | 2017年清华-青岛数据科学研究院“RONG”奖学金即将开放申请

各有关同学:   为促进大数据人才培养,服务国家大数据发展战略,清华-青岛数据科学研究院(简称:数据科学研究院)设立“RONG”奖学金,申请通道将于12月1日开启。奖学金面向全校各院系获得“大数据能力提升项目”证书的在学研究生,奖励比例高达35%!希望各院系符合申请条件的研究生踊跃申请。“RO...

2017-11-28 00:00:00

阅读数:158

评论数:0

报名 | 大数据下的自杀风险感知与疏导讲座

自杀是困扰全世界的一个社会性问题,鉴于自杀给个人、家庭和社会带来的巨大情感创伤和经济损失,及时有效地感知和预防这种极端行为极为必要。心理学研究成果表明长期慢性压力是导致自杀发生的主要原因之一。本场讲座将探讨如何通过网络社交媒体大数据,从慢性压力的角度进行自杀危险感知,以及如何从压力源头进行疏导排解...

2017-11-28 00:00:00

阅读数:110

评论数:0

教你用300万共享单车出行数据,预测骑行目的地 !(附源码)

来源:大数据挖掘DT数据分析 本文长度为1647字,建议阅读3分钟 本文为你介绍使用出行记录数据和源码预测摩拜出行目的地的方法。 后台回复关键词“摩拜” 获取本文数据及源码地址。 摩拜单车在北京的单车投放量已经超过40万。用户可以直接在人行道上找到停放的单车,用手机...

2017-11-28 00:00:00

阅读数:1344

评论数:0

怎样构建中文文本标注工具?(附工具、代码、论文等资源)

来源:Paperweekly 本文长度为2218字,建议阅读4分钟 本文为你介绍中文文本标注工具的构建方法,并提供多个开源文本标注工具。 项目地址: https://github.com/crownpku/Chinese-Annotator 自然语言处理...

2017-11-26 00:00:00

阅读数:217

评论数:0

楼天城:世界顶尖黑客、曾被脸书谷歌青睐的中国大学生编程第一人

来源:程序人生 作者:小七 本文长度为2910字,建议阅读5分钟 本文为你介绍中国大学生编程第一人:楼天城。 楼天城,有「中国大学生计算机编程第一人」的称号,也被参加竞赛的学子们敬称为「楼教主」。李开复说他是未来推动中国互联网产业发展的中流砥柱!他的传奇经历一直激励着众多年轻学...

2017-11-26 00:00:00

阅读数:222

评论数:0

近期活动盘点:基于雷达图像预测未来降水参赛经验分享、智慧政府讲座、金融AI思享会、数据法学研讨会(11.29-11.30)

想知道近期有什么最新活动?大数点为你整理的近期活动信息在此: CIKM AnalytiCup 2017—基于雷达图像预测未来降水参赛经验分享 2017年11月29日 活动简介: 清华大学清华-青岛数据科学研究院一直致力于面向校内外的大数据领域传播知识,继清华大数据“技术...

2017-11-25 00:00:00

阅读数:134

评论数:0

教你用TensorFlow实现神经网络(附代码)

来源:云栖社区 作者:Pavel Surmenok 本文长度为2600字,建议阅读5分钟 本文帮助你理解神经网络的应用,并使用TensorFlow解决现实生活中的问题。 如果你一直关注数据科学/机器学习,你就不能错过深度学习和神经网络的热潮。互联网公司正在寻找这方面的人,而且从...

2017-11-25 00:00:00

阅读数:339

评论数:0

手把手教你估算深度神经网络的最优学习率(附代码&教程)

来源:机器之心 作者:Pavel Surmenok 本文长度为2000字,建议阅读4分钟 学习率(learning rate)是调整深度神经网络最重要的超参数之一,本文作者Pavel Surmenok描述了一个简单而有效的办法来帮助你找寻合理的学习率。 我正在旧金山...

2017-11-24 00:00:00

阅读数:806

评论数:0

报名 | 大数据打造智慧的政府门户讲座

随着互联网的不断发展,社会群众对政府网站的要求越来越高,而国务院办公厅在2017年5月发布了《政府网站发展指引》,目标是推进互联网政务信息数据和便民服务平台建设,提升政府网上服务能力。围绕这个话题,本次清华大数据“应用·创新”系列讲座将会探讨如何实现电子政务,用大数据打造智慧的政府门户。 ...

2017-11-23 00:00:00

阅读数:113

评论数:0

独家 | 手把手教你用Python 3创建用于机器学习开发的Linux虚拟机(附安装教程&代码)

原文标题:How to Create a Linux Virtual Machine For Machine Learning Development With Python 3 作者:Jason Brownlee 翻译:杨金鸿 翻译校对:白静 文字校对:丁楠雅 本文长度为3000字,建...

2017-11-23 00:00:00

阅读数:542

评论数:0

我是怎样爬下6万共享单车数据并进行分析的(附代码)

来源:钱塘大数据 本文长度为3297字,建议阅读7分钟 本文为你解答用Pyhon获取、分析单车数据的过程,并为你分析得出的结论。 后台回复关键词“摩拜”获取完整源码(文末有福利呦~) 共享经济的浪潮席卷着各行各业,而出行行业是这股大潮中的主要分支。如今,在城市中随处可见共享...

2017-11-22 00:00:00

阅读数:240

评论数:0

张长水主任当选2018年IEEE Fellow!中国大陆17位当选者清华占了5位 !(附完整名单)

日前,全球最大的非营利专业技术学会IEEE(国际电气与电子工程师协会)公布了2018年度Fellow名单,中国大陆共有17位科学家当选新一届IEEE Fellow,其中清华大学张长水、舒继武、孙宏斌、赵争鸣、周彤5人当选。 张长水教授简介: 张长水,清华-青岛数...

2017-11-22 00:00:00

阅读数:242

评论数:0

清华大学大数据能力提升项目三名学生斩获2017年中国高校SAS数据分析大赛亚军

2017年11月20日,2017中国高校SAS数据分析大赛颁奖典礼在钓鱼台国宾馆举行。清华大学今年首次组队参赛,在与北京大学、人民大学、复旦大学等1036支参赛团队激烈比拼后,清华大学大数据能力提升项目的三位学生——王存光、姚超、李继凡组成的团队一举荣获亚军。 颁奖典礼现场 ...

2017-11-21 00:00:00

阅读数:416

评论数:0

教你用TensorFlow和自编码器模型生成手写数字(附代码)

来源:机器之心 本文长度为1876字,建议阅读4分钟 本文介绍了如何使用 TensorFlow 实现变分自编码器(VAE)模型,并通过简单的手写数字生成案例一步步引导读者实现这一强大的生成模型。 自编码器是一种能够用来学习对输入数据高效编码的神经网络。若给定一些输入,神经网络...

2017-11-21 00:00:00

阅读数:225

评论数:0

各类机器学习问题的最优结果合集!附论文及实现地址索引

来源:中国大数据 本文长度为2721字,建议阅读4分钟 本文为你介绍RedditSota 统计的各种机器学习任务的最顶级研究成果(论文)。 该 GitHub 库提供了所有机器学习问题的当前最优结果,并尽最大努力保证该库是最新的。如果你发现某个问题的当前最优结果已过时或...

2017-11-19 00:00:00

阅读数:117

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭