![](https://img-blog.csdnimg.cn/20190422164615282.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
UCB Data8 计算与推断思维
文章平均质量分 96
UCB Data8 计算与推断思维
绝不原创的飞龙
这个作者很懒,什么都没留下…
展开
-
计算与推断思维 翻译完成
面向(未来的)数据科学家的入门课来咯~前一半讲 Python 编程,后一半讲统计学基本概念并用 Python 模拟。Github:https://github.com/Kivy-CN/data8-textbook-zhGitee:https://gitee.com/wizardforcel/data8-textbook-zh电子书还没生成好,由于存在 SVG 图片,工具会报错,在线翻译 2018-01-28 00:30:56 · 39139 阅读 · 0 评论 -
计算与推断思维 十六、比较两个样本
十六、比较两个样本 原文:Comparing Two Samples 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译最近邻分类方法的动机是这样的,个体可能像最近的邻居。 从另一个角度来看,我们可以说一个类别的个体不像另一个类别中的个体。 机器学习为我们提供了一种有力的方法来发现这种相似性的缺乏,并将其用于分类。 它揭示了一种模式,通翻译 2018-01-28 00:18:16 · 36927 阅读 · 0 评论 -
计算与推断思维 十五、分类
十五、分类 原文:Classification 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译David Wagner 是这一章的主要作者。机器学习是一类技术,用于自动寻找数据中的规律,并使用它来推断或预测。你已经看到了线性回归,这是一种机器学习技术。本章介绍一个新的技术:分类。分类就是学习如何根据过去的例子做出预测。我们举翻译 2018-01-28 00:08:33 · 38137 阅读 · 0 评论 -
计算与推断思维 十三、预测
十三、预测 原文:Prediction 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译数据科学的一个重要方面,是发现数据可以告诉我们什么未来的事情。气候和污染的数据说了几十年内温度的什么事情?根据一个人的互联网个人信息,哪些网站可能会让他感兴趣?病人的病史如何用来判断他或她对治疗的反应?为了回答这样的问题,数据科学家已经开发出了翻译 2018-01-27 23:48:28 · 39690 阅读 · 0 评论 -
计算与推断思维 十二、为什么均值重要
十二、为什么均值重要 原文:Why the Mean Matters 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译在这个课程中,我们已经研究了几个不同的统计量,包括总编译距离,最大值,中位数和平均值。在关于随机性的明确假设下,我们绘制了所有这些统计量的经验分布。有些统计量,比如最大和总变异距离,分布明显偏向一个方向。但是,无论研究翻译 2018-01-27 22:50:54 · 45666 阅读 · 1 评论 -
计算与推断思维 十四、回归的推断
十四、回归的推断 原文:Inference for Regression 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译到目前为止,我们对变量之间关系的分析纯粹是描述性的。我们知道如何找到穿过散点图的最佳直线来绘制。在所有直线中它的估计的均方误差最小,从这个角度来看,这条线是最好的。但是,如果我们的数据是更大总体的样本呢?如果我翻译 2018-01-18 20:11:09 · 37983 阅读 · 0 评论 -
计算与推断思维 十一、估计
十一、估计 原文:Estimation 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译在前一章中,我们开始开发推断思维的方法。特别是,我们学会了如何使用数据,在世界的两个假设之间做决策。但是我们通常只想知道,某件事情有多大。例如,在前面的章节中,我们调查了敌人可能拥有的战机数量。在选举年,我们可能想知道有多少选民赞成特定候选人。翻译 2018-01-18 20:00:08 · 38368 阅读 · 0 评论 -
计算与推断思维 十七、更新预测
十七、更新预测 原文:Updating Predictions 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译我们知道如何使用训练数据将一个点划分为两类之一。 我们的分类只是对类别的预测,基于最接近我们的新点的,训练点中最常见的类别。假设我们最终发现了我们的新点的真实类别。 然后我们会知道我们的分类是否正确。 另外,我们将会有一翻译 2018-01-18 19:43:29 · 36851 阅读 · 0 评论 -
计算与推断思维 二、因果和实验
二、因果和实验 原文:Causality and Experiments 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译“这些问题已经,而且可能永远留在自然界难以捉摸的秘密之中,它们属于人类智力根本难以接近的一类问题。 - 1849 年 9 月,伦敦时报,霍乱如何传染和传播死刑有威慑作用吗?巧克力对你有好处吗?什么导致乳腺癌?翻译 2018-01-17 22:35:02 · 37927 阅读 · 0 评论 -
计算与推断思维 十、假设检验
十、假设检验 原文:Testing Hypotheses 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译数据科学家们经常面对世界的是或不是的问题。你在这个课程中看到了一些这样的问题的例子:巧克力对你有好处吗?Broad Street 水泵的水是否会导致霍乱?加州的人口统计在过去的十年中有所改变吗?我们是否回答这些问题取决于我们的数据。翻译 2018-01-04 09:09:52 · 38835 阅读 · 0 评论 -
计算与推断思维 九、经验分布
九、经验分布 原文:Empirical Distributions 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译大部分数据科学都涉及来自大型随机样本的数据。 在本节中,我们将研究这些样本的一些属性。我们将从一个简单的实验开始:多次掷骰子并跟踪出现的点数。 die表包含骰子面上的点数。 所有的数字只出现一次,因为我们假设骰子是平等的。die翻译 2017-12-31 13:33:38 · 41639 阅读 · 0 评论 -
计算与推断思维 八、随机性
八、随机性 原文:Randomness 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译在前面的章节中,我们开发了深入描述数据所需的技能。 数据科学家也必须能够理解随机性。 例如,他们必须能够随机将个体分配到实验组和对照组,然后试图说明,观察到的两组结果之间的差异是否仅仅是由于随机分配,或真正由于实验所致。在这一章中,我们开始分析随机性。 首先翻译 2017-12-28 23:00:02 · 39100 阅读 · 0 评论 -
计算与推断思维 七、函数和表格
七、函数和表格 原文:Functions and Tables 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译通过使用 Python 中已有的函数,我们正在建立一个使用的技术清单,用于识别数据集中的规律和主题。 现在我们将探索Python编程语言的核心功能:函数定义。我们在本书中已经广泛使用了函数,但从未定义过我们自己的函数。定义一个函数的目翻译 2017-12-27 14:03:35 · 39098 阅读 · 0 评论 -
计算与推断思维 六、可视化
六、可视化 原文:Visualization 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译表格是一种组织和可视化数据的强大方式。然而,无论数据如何组织,数字的大型表格可能难以解释。 有时解释图片比数字容易得多。在本章中,我们将开发一些数据分析的基本图形方法。 我们的数据源是互联网电影数据库(IMDB),这是一个在线数据库,包含电影,电视节目翻译 2017-11-18 21:13:02 · 38608 阅读 · 0 评论 -
计算与推断思维 四、数据类型
四、数据类型 原文:Data Types 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译每个值都有一个类型,内建的type函数返回任何表达式的结果的类型:type(3)inttype(3/1)float表达式的type是其最终值的类型。 所以,type函数永远不会表明,表达式的类型是一个名称,因为名称总是求值为它们被赋予的值。x = 3翻译 2017-11-18 21:07:49 · 37142 阅读 · 0 评论 -
计算与推断思维 五、表格
五、表格 原文:Tables 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译表格是表示数据集的基本对象类型。 表格可以用两种方式查看:具名列的序列,每列都描述数据集中所有条目的一个方面,或者行的序列,每行都包含数据集中单个条目的所有信息。为了使用表格,导入所有称为datascience的模块,这是为这篇文章创建的模块。from data翻译 2017-11-18 21:05:17 · 37671 阅读 · 0 评论 -
计算与推断思维 一、数据科学
一、数据科学 原文:Data Science 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译什么是数据科学数据科学是通过探索,预测和推断,从大量不同的数据集中得出有用的结论。探索涉及识别信息中的规律。预测涉及使用我们所知道的信息,对我们希望知道的值作出知情的猜测。推断涉及量化我们的确定程度:我们发现的这些规律是否也出现在新的观察中?我们的预测翻译 2017-11-11 21:30:35 · 38066 阅读 · 0 评论 -
计算与推断思维 三、Python 编程
三、Python 编程 原文:Programming in Python 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译编程可以极大地提高我们收集和分析世界信息的能力,而这些信息又可以通过上一节所述的谨慎推理来发现。 在数据科学中,编写程序的目的是,指示计算机执行分析步骤。 电脑无法自行研究世界。 人们必须准确描述计算机应该执行什么步骤来收集翻译 2017-11-11 21:23:44 · 37691 阅读 · 0 评论