![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据科学
DrCrypto
这个作者很懒,什么都没留下…
展开
-
【数据科学】什么是数据科学?
数据是现实世界运转留下的痕迹。这些痕迹如何展示出来,则取决于我们采用什么样的数据收集和样本采集方法。将具象的数据转化为抽象的数据,过程是绝对主观的。数据的随机性和不确定性来源:过程本身数据采集方法统计推断关注的是如何从随机过程产生的数据中提取信息。关于建模数据即信息,不需要模型,了解相关性就够了。–Anderson这是错误的想法。什么是模型模型是一个特殊的镜片,...原创 2018-11-22 16:42:22 · 557 阅读 · 0 评论 -
【数据科学】探索性数据分析
通常表现为:画一些直方图等,来看看数据的分布。看起来探索性数据分析只是很小的一部分,其实它的地位很重要,是数据可科学中的重要一环。这个像太祖长拳,用在不同的人手里,会有不同的效果。换句话说,随着你的认知的提升,探索性数据分析能够得出的东西是完全不同的。基本工具图,表以及汇总统计量。探索性数据分析是什么是一种系统性分析数据的方法:用盒形图展示所有变量的分布情况用散点图展示变量两两之...原创 2018-11-22 16:57:42 · 529 阅读 · 0 评论 -
【数据科学】kNN算法笔记
kNN的主要思想:根据某个对象的属性值找到相似的对象们,让对象们一起投票决定这个对象属于哪一类。这里银行的信息是,根据属性值找到的对象们,并不是来源于一个类,如果是一个类的话,直接将这个待分类对象归类为此类就完成了。既然是投票,就意味着可能是平票,如果平了的话,就随便选择一个类作为此类的分类即可。《数据科学实战》这本书里举的例子很贴近我们的生活,引用过来,作为参考:假设一个人会对自己看过...原创 2018-11-27 11:07:01 · 434 阅读 · 0 评论 -
【数据科学】什么是数据分析
数据分析是将原始数据进行排序和组织的过程,是用来帮助解释过去和预测未来的一系列方法。数据分析不是只针对数字进行分析,而是关于:如何设定/提出问题演化解释验证假设数据的本质现实世界所有场景都包含数据,数据分为:结构化/非结构化连续/离散…有不同的分类方法,从更普遍的意义上来看,数据分为:分类型数值型其中,分类型中又分为:定类:如住房类型定序:如年龄...原创 2018-12-25 18:32:14 · 400 阅读 · 0 评论