数据派THU

发布清华大学数据科学相关科研动态、教学成果及线下活动

元旦快乐!今天我居然登上了数据派头条!

从今天起,我们告别了2017,迎来崭新的2018年。回首这一年,数据派的成长离不开志愿者和粉丝们一直以来的支持和陪伴,点点认识了很多新朋友也重逢了很多老朋友,每次我们的讲座活动,摄影师也都会记录下演讲台下的主角,你们的身影点点会一直珍存。 相信大家在这个温暖又充满分享精神的平台上都会有所收获,20...

2018-01-01 00:00:00

阅读数:113

评论数:0

为你分享10篇NLP、CV领域优质论文

来源:PaperDaily本文长度为2200字,建议阅读6分钟本文为你盘点近期值得关注的NLP、CV领域相关论文。自然语言处理01Knowledge Graph Embedding: A Survey of Approaches and Applications@jerryshi 推荐#Knowl...

2017-12-31 00:00:00

阅读数:117

评论数:0

数据派新年寄语 | 新时代,新年好!

关于2017 2017,是人工智能走向繁荣的一年。AI江湖风起云涌,无意的一颗石子则激起千层浪。 AlphaGo2.0以3:0完胜柯洁▼它太完美我很痛苦,看不到任何胜利的希望。---柯洁赛后哽咽。 “人工智能”首次写入政府工作报告▼率先布局、把握机遇,这是属于历史的接力棒。 国务院出台《新一代人工...

2017-12-30 00:00:00

阅读数:155

评论数:0

一文读懂卷积神经网络CNN(学习笔记)

来源:机器学习算法与自然语言处理作者:白雪峰本文为图文结合,建议阅读10分钟。本文为大家解读如何简单明了的解释卷积,并且分享了学习中的一些方法案例。首先文章的提纲为:CNN栗子镇楼What is CNN            什么是卷积            什么是池化Why CNN对CNN的其他...

2017-12-29 00:00:00

阅读数:182

评论数:0

数据蒋堂 | JOIN延伸 - 维度概念

来源:数据蒋堂作者:蒋步星本文长度为1320字,建议阅读3分钟本文为你讲解维度概念。谈到数据分析时常常会用到维度这个词,针对数据立方体的钻取、旋转、切片等操作都是围绕维度进行的,几乎所有的数据分析人员都知道并会运用这个术语,但要问及它的定义,却几乎没有人能给出来。通俗来讲,我们把用来分类的属性(字...

2017-12-28 00:00:00

阅读数:127

评论数:0

机器智能加速器:大数据环境下知识工程的机遇和挑战 | 清华李涓子教授

导读:知识图谱已经成为推动人工智能发展的核心驱动力之一。本文选自清华大学计算机科学与技术系教授、清华-青岛数据科学研究院科技大数据研究中心主任李涓子老师于2017年12月20日在阿里联合中文信息学会语言与知识计算专委会举办的知识图谱研讨会上做的以“知识工程:机器智能的加速器”为题的报告。李涓子老师...

2017-12-28 00:00:00

阅读数:427

评论数:0

教你用百度地图API抓取建筑物周边位置、房价信息(附代码)

来源:大数据挖掘DT数据分析本文共2465字,建议阅读5分钟。本文为大家解读怎样用脚本与百度API的交互,爬取百度地图的数据。需求描述对于数据挖掘工程师来说,有时候需要抓取地理位置信息,比如统计房子周边基础设施信息,比如医院、公交车站、写字楼、地铁站、商场等,一般的爬虫可以采用python脚本爬取...

2017-12-27 00:00:00

阅读数:1009

评论数:0

为你分享73篇论文解决深度强化学习的18个关键问题

来源:PaperWeekly作者:王凌霄本文共2434字,建议阅读5分钟。本文为大家分享了73篇论文,介绍深度学习的方法策略以及关键问题分析。这两天我阅读了两篇篇猛文 A Brief Survey of Deep Reinforcement Learning 和 Deep Reinforcemen...

2017-12-26 00:00:00

阅读数:425

评论数:0

跨学科融合、塑π型人才 数据科学研究院 第二届“RONG”奖学金答辩会成功举办

为服务国家大数据发展战略,打造多层次、多类型的大数据人才队伍,清华-青岛数据科学研究院(以下简称:数据院)“RONG”奖学金答辩会于2017年12月21日成功举办。数据院大数据能力提升项目教育指导委员会主任刘政,研究生院专硕办副主任李鹏辉,数据院执行副院长韩亦舜,数据院“RONG”教授兼社科学院社...

2017-12-26 00:00:00

阅读数:88

评论数:0

教你用OpenCV人脸检测自动给头像戴圣诞帽(附代码)

来源:老王和他的IT界朋友们作者:流川疯本文长度为3400字,建议阅读7分钟跟着代码走,教你自动给头像带上圣诞帽。原图: 效果:  原理其实很简单:采用一张圣诞帽的png图像作为素材 利用png图像背景是透明的,贴在背景图片上就是戴帽子的效果了。人脸检测的目的主要是为了确定贴帽子的位置,类似ps中...

2017-12-23 00:00:00

阅读数:156

评论数:0

揭秘深度学习成功的数学原因:从全局最优性到学习表征不变性

来源:机器之心本文长度为4900字,建议阅读7分钟本文为深层网络的若干属性,如全局最优性、几何稳定性、学习表征不变性,提供了一个数学证明。近年来,深度学习大获成功,尤其是卷积神经网络(CNN)在图像识别任务上的突出表现。然而,由于黑箱的存在,这种成功一度让机器学习理论学家颇感不解。本文的目的正是要...

2017-12-22 00:00:00

阅读数:103

评论数:0

放弃“for循环”,教你用这种算法 !(附代码)

原文标题:Why you should forget ‘for-loop’ for data science code and embrace vectorization作者:Tirthajyoti Sarkar翻译:杨金鸿校对:丁楠雅本文长度为1986字,建议阅读5分钟数据科学需要快速计算和数据...

2017-12-21 00:00:00

阅读数:693

评论数:0

独家 | 10分钟带你上手TensorFlow实践(附代码)

原文标题:TensorFlow Tutorial: 10 minutes Practical TensorFlow lesson for quick learners作者:ANKIT SACHAN翻译:和中华校对:程思衍本文长度为2000字,建议阅读10分钟通过这篇文章,你可以了解TensorFl...

2017-12-20 00:00:00

阅读数:189

评论数:0

2017年深度学习必读31篇论文(附下载地址)

来源:新智元本文长度为4100字,建议阅读6分钟本文为你盘点今年最值得关注的深度学习相关论文。2017年即将擦肩而过,Kloud Strife在其博客上盘点了今年最值得关注的有关深度学习的论文,包括架构/模型、生成模型、强化学习、SGD & 优化及理论等各个方面,有些论文名扬四海,有些论文...

2017-12-19 00:00:00

阅读数:327

评论数:0

从零开始用Python构造决策树(附公式、代码)

来源:Python中文社区作者:weapon本文长度为700字,建议阅读5分钟本文介绍如何不利用第三方库,仅用python自带的标准库来构造一个决策树。起步熵的计算:根据计算公式:对应的 python 代码:条件熵的计算:根据计算方法:对应的 python 代码:其中参数 future_list ...

2017-12-18 00:00:00

阅读数:211

评论数:0

院长齐聚,答疑解惑 | 清华-青岛数据科学研究院“院长接待日”成功举办

2017年12月14日下午,清华-青岛数据科学研究院(以下简称:数据院)“院长接待日”活动在双清大厦四层成功举行。院长俞士纶、副院长王建民和执行副院长韩亦舜与来自校内不同院系对大数据感兴趣的同学面对面分享学术、科研经验,教育指导委员会主任刘政也放下手头工作,赶来与同学见面。几位领导从专业角度为同学...

2017-12-18 00:00:00

阅读数:477

评论数:0

独家 | 一文读懂LinkedIn个性化推荐模型及建模原理

原文标题:HowLinkedIn Makes Personalized Recommendations via Photon-ML Machine Learning tool作者:Yiming Ma, Deepak Agarwal翻译:张媛校对:丁楠雅本文长度为2500字,建议阅读8分钟本文将重点...

2017-12-17 00:00:00

阅读数:229

评论数:0

清华成立“脑与智能”和“未来”两大实验室,跨学科AI深度融合

来源:新智元本文长度为3400字,建议阅读10分钟清华大学于本月15日一口气成立了两个跨学科的研究机构——“清华大学脑与智能实验室”和“清华大学未来实验室”,它们都与人工智能有着密不可分的联系。清华大学于本月15日一口气成立了两个跨学科的研究机构——“清华大学脑与智能实验室”和“清华大学未来实验室...

2017-12-17 00:00:00

阅读数:146

评论数:1

从零开始教你训练神经网络(附公式&学习资源)

来源:机器之心作者:Vitaly Bushaev本文长度为8900字,建议阅读15分钟本文从神经网络简单的数学定义开始,沿着损失函数、激活函数和反向传播等方法进一步描述基本的优化算法。作者从神经网络简单的数学定义开始,沿着损失函数、激活函数和反向传播等方法进一步描述基本的优化算法。在理解这些基础后...

2017-12-16 00:00:00

阅读数:270

评论数:0

近期活动盘点:智慧园区大数据精准招商思享会、数据法学研讨会、海外学者短期讲学(12.21-12.24)

想知道近期有什么最新活动?大数点为你整理的近期活动信息在此:智慧园区之大数据精准招商与服务思享会2017年12月21日活动简介:目前,产业园区、写字楼等企业空间以及政府招商部门等普遍存在招商成本上升、传统招商手段失效、服务缺乏人力物力等问题。然而互联网、人工智能、大数据等技术的成熟,为解决类似问题...

2017-12-16 00:00:00

阅读数:171

评论数:1

提示
确定要删除当前文章?
取消 删除
关闭
关闭