数据派THU

发布清华大学数据科学相关科研动态、教学成果及线下活动

独家 | 教你实现数据集多维可视化(附代码)

翻译:张媛校对:卢苗苗本文共8269字,建议阅读10分钟。用代码将你的数据集进行多维可视化!介绍描述性分析是与数据科学或特定研究相关的任何分析生命周期中的核心组成部分之一。数据聚合,汇总与可视化是支撑数据分析这一领域的主要支柱。从传统商业智能时代开始,即使在如今的人工智能时代,数据可视化一直是一种...

2018-03-01 00:00:00

阅读数:287

评论数:0

独家 | 如何解决深度学习泛化理论

作者:Dmytrii S.翻译:陈之炎校对:卢苗苗本文共2360字,建议阅读5分钟。本文与大家讨论深度学习泛化理论中的一些经验并试图对它做出解释。我们可以从最新的关于深度学习“炼金术”的悖论研究中了解一二。动机深度学习目前正被用于方方面面。但是,人们经常批评它缺乏一个基础理论,能够完全解释其为什么...

2018-02-28 00:00:00

阅读数:315

评论数:0

数据蒋堂 | 谈谈临时性计算

作者:蒋步星来源:数据蒋堂本文约2000字,建议阅读5分钟。通过本文带大家评估了一下三种处理临时性计算的优劣。临时性计算,顾名思义,是指临时发生的一些计算需求。这种计算在日常数据处理中很常见,我们举一些例子:应对业务部门的取数需求:比如销售部门想获得进行了某项促销活动前后的销售情况变化信息;数据挖...

2018-02-28 00:00:00

阅读数:197

评论数:0

Facebook如何运用机器学习进行亿级用户数据处理

来源:人工智能头条编译:刘畅、尚岩奇、林椿眄审校:reason_W本文约14000字,建议阅读20分钟。本文为大家带来Facebook在处理亿级用户数据时候的方法。2017年末,Facebook应用机器学习组发布最新论文,对整个Facebook的机器学习软硬件架构进行了介绍。纵览全文,我们也可以从...

2018-02-27 00:00:00

阅读数:199

评论数:0

Python实例介绍正则化贪心森林算法(附代码)

作者:Ankit Chaoudhary翻译:笪洁琼校对:梁傅淇本文共3515字,建议阅读7分钟。通过本文与大家讨论一个被称为正则化的贪心森林算法。引言作为一名参与多个机器学习竞赛数据科学家,我总是在寻找“尚未流行”的算法。我是这样定义这些算法的:它们本身最终不会成为竞赛里的赢家,但是它们会给的预测...

2018-02-26 00:00:00

阅读数:306

评论数:0

50个“杀手级”AI项目 !(附链接)

原文链接:https://hackernoon.com/50-killer-ai-projects-f1b6966c7dbc原文标题:50 Killer AI Project编译:言泽作者:Steffi S本文约2000字,建议阅读5分钟。本文为大家带来50个当下正火的AI项目,总有一个会让你感兴...

2018-02-25 00:00:00

阅读数:242

评论数:0

数据蒋堂 | 报表开发的现状

作者:蒋步星来源:数据蒋堂本文共1692字,建议阅读5分钟。通过本文为大家解读报表开发难点重点和现状问题。报表开发,看起来只是数据呈现环节的事务,并不起眼,但仔细想想,它涉及的工作范围却非常广。如果把查询和交互分析也认为是报表事务的话(呈现形式本来也是报表),那么可以说,绝大多数ETL都是在为报表...

2018-02-23 00:00:00

阅读数:231

评论数:0

手把手带你复现AI+区块链写码全过程!(附代码&视频)

作者:Siraj Raval来源:AI科技评论本文约1000字,建议阅读7分钟。本文和大家讨论AI和区块链如何一起工作,并且在在 python 中编写工作证明算法,然后在高层次上讨论一些其他的共识算法。比特币的剧烈震荡,引起全民关注,加快了区块链的普及速度。区块链养猫养狗、区块链游戏、区块链游戏,...

2018-02-23 00:00:00

阅读数:423

评论数:0

大年初七,发paper、学Python...分享一下你的学习计划吧~

今天是大年初七,今天是人日,上天造物顺序一鸡二狗三羊...七人!快快恢复元气,努力工作!欢迎参与今天的话题讨论:发paper、学Python...分享一下你的学习计划吧~欢迎留言,参与今天的话题讨论

2018-02-22 00:00:00

阅读数:344

评论数:0

大年初六,你最崇拜的数据科学大咖是谁?

今天是大年初六,今天是开业日,创业的朋友们恭喜发财(红包拿来)!欢迎参与今天的话题讨论:你最崇拜的数据科学大咖是谁?欢迎留言,参与今天的话题讨论

2018-02-21 00:00:00

阅读数:245

评论数:0

大年初五,Python、Go、C...你最爱用哪种语言?

今天是大年初五,一起赶五穷吧(智穷、学穷、文穷、命穷和交穷)!欢迎参与今天的话题讨论:Python、Go、C...你最爱用哪种语言,为什么?也欢迎用Python的朋友们留言推荐好用的Python包~欢迎留言,参与今天的话题讨论

2018-02-20 00:00:00

阅读数:290

评论数:0

大年初四,你认为在南方过年和在北方过年最大的不同是什么?

今天是大年初四,记得备好糕果、香烛、水果,一起恭迎财神喽!欢迎参与今天的话题讨论:你认为在南方过年和在北方过年最大的不同是什么?欢迎留言,参与今天的话题讨论

2018-02-19 00:00:00

阅读数:223

评论数:0

大年初三,过年期间最让你受不了的习俗有哪些?

今天是大年初三,传说今天容易与人发生争执,不宜出门拜年哦!欢迎参与今天的话题讨论:过年期间最让你受不了的习俗有哪些?欢迎留言,参与今天的话题讨论

2018-02-18 00:00:00

阅读数:271

评论数:0

大年初二,今年过年你选择在男方家过还是女方家过?

今天是大年初二,别忘了今天出嫁的女儿要带着女婿一起回娘家哦!今年过年你选择在男方家过还是女方家过?欢迎留言,参与今天的话题讨论

2018-02-17 00:00:00

阅读数:241

评论数:0

大年初一,今年的春晚你看了吗?

今天是大年初一,据说主动拜年和发红包的人一整年运气都不会差哦!欢迎参与今天的话题讨论:今年的春晚你看了吗?欢迎留言,参与今天的话题讨论

2018-02-16 00:00:00

阅读数:212

评论数:0

2018新年快乐 !(附幸运读者名单)

大数点、红数点和小数点给大家拜年啦!恭祝各位数据派的粉丝们2018新年快乐!心想事成!恭喜以下三位敲幸运的朋友,2018鸿运当头啦!(请私信红数点,微信:hongpingguo2016,索要图书!)另外,接下来的七天,数据派将会推出“过年七天TALK”,和大家一起讨论过年期间躲不掉的那些问题,欢迎...

2018-02-15 00:00:00

阅读数:268

评论数:0

清华大学计算机系李涓子、唐杰老师获北京市最高科学奖(附一等奖名单)

2月5日上午,在北京会议中心大报告厅,中科院院士、中科院化学所研究员刘云圻,清华大学计算机系副教授唐杰等科学家代表,从市委书记蔡奇,市委副书记、市长陈吉宁,科技部副部长李萌等科技部和北京市领导手中接过北京市科学技术奖一等奖获奖证书。 陈吉宁在讲话中向为首都科技事业发展作出贡献的全体科技工作者致以崇...

2018-02-14 00:00:00

阅读数:636

评论数:0

非单身勿点,这里是单身汪专属情人节~

当你打开这个页面,机智的点点猜想——很有可能你正在过一个没有情人的情人节,不如就和同样单身的红数点(下图此人)在这个虐狗的日子里相依为命吧!  如果你拥有满身的浪漫细菌无处释放,不如在这里跟数据派的小伙伴儿表白一番喽,(注:和数据派相关的人物均可,比如某场讲座坐在你旁边的那个他(她)、某位演讲大咖...

2018-02-14 00:00:00

阅读数:283

评论数:0

数据蒋堂 | DB与NoSQL的访问性能

作者:蒋步星来源:数据蒋堂本文约1500字,建议阅读5分钟。通过本文为大家带来怎么在高性能和数据多样性之间抉择数据处理。我们继续从软件角度上看外存数据源的性能,考察数据库的性能特点,在这篇文章中,我们只关心数据的访问性能,而不涉及计算性能。关系数据库关系数据库也是很常见的数据存储方式。本质上讲,数...

2018-02-13 00:00:00

阅读数:235

评论数:0

教你简单解决过拟合问题(附公式)

作者:Ahmed Gad翻译:韩海畴校对:丁楠雅本文约2000字,建议阅读5分钟。本文带大家认识了什么是过拟合,并且示范了用正则化的方法来避免过拟合的问题。多项式回归&过拟合你可能训练过这样的机器学习模型,它在训练样本上表现得无可挑剔,却在新样本预测上一塌糊涂。你可曾想过为什么会发生这种问...

2018-02-13 00:00:00

阅读数:582

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭