![](https://img-blog.csdnimg.cn/20190927151053287.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据分析
大白羊的进阶之路
这个作者很懒,什么都没留下…
展开
-
数据挖掘学习(一)
数据质量通常不完美,存在的问题:噪声、离群点。数据集的一般特性:纬度、稀疏性、分辨率。数据集的维度:是数据集中的对象具有的属性数目。低纬度数据往往与中、高维度数据有着质的不同。分析高维数据有事会陷入数据灾难,所以再进行数据与处理时 减少维度很重要。稀疏性:指的是数据集的属性上大部分的值为0;分辨率:数据的模式依赖于分辨率,分辨率太高,噪声严重,模式可能被掩藏在噪声中;分辨率太低,则...原创 2018-08-11 21:24:38 · 834 阅读 · 0 评论 -
数据挖掘学习(二)——分类
定义 分类(classification)分类任务就是通过学习得到一个目标函数f , 把每个属性集x映射到一个预先定义的类标号y. 目标函数也称分类模型(classification model)。分类模型可以用于以下目的。①描述性建模。 分类模型可以作为解释性工具,用于区分不同类中的对象。②预测性建模。分类模型还可以用于预测未知记录的类标号。分类模型可以看作一个黑箱,当给定位置记录的属...原创 2018-08-12 17:36:57 · 1061 阅读 · 0 评论 -
数据挖掘学习(三)——分类 之人工神经网络
感知器就是一个单层的前馈神经网络。感知器只能构造一个超平面,所以无法解决XOR问题。多层神经网络,包括输入层、隐藏层和输出层。支持向量机(support vector machine,SVM),具有坚实的统计学理论基础,这种方法具有一个独特的特点,他使用训练实例的一个子集来表示决策边界,该子集乘坐支持向量(support vector)。 SVM与最大边缘超平面关系密切,超平面可将训...原创 2018-08-12 21:27:55 · 673 阅读 · 0 评论 -
API(1): API中的数据类型, JSON 与 XML
API的大部分数据都是JSON或XML格式JSON ——JavaScriptobjectnotation ,JavaScript对象标记;xml代表可延伸标记语言。上面的数据很不自然,JSON对于展现和读取具有复杂结构的数据特别有用。JSON构建在两个关键结构上:1.JSON 对象:键值对2.JSON 数组:可以作为键值对中的值...原创 2019-04-25 22:27:57 · 679 阅读 · 0 评论 -
数据分析(1)数据分析全景图
markdown数据分析全景图数据分析的组成三个组成部分的图片展示:数据分析全景图学习一门知识,应该尽可能从多个角度对其进行认识。数据分析的组成数据分析由三个部分组成:- 数据采集- 数据挖掘: **数据分析中商业价值的所在。数据挖掘的核心是挖掘数据的商业价值,即人们常谈的商业智能 BI**- 数据可视化三个组成部分的图片展示:数据采集数据挖掘需要掌握常用的十大算法,...原创 2019-09-29 16:33:13 · 812 阅读 · 0 评论 -
数据分析(2)学习数据挖掘的最佳路径
数据挖掘知识清单一.数据挖掘基本流程- six steps商业理解 - 目的挖掘不是目的,帮助业务才是目的,从商业的角度理解项目需求,再开始定义挖掘目的数据理解 - 初步认知收集、探索数据,包含数据描述、数据质量验证等数据准备 - 收集清洗、数据集成等准备工作模型建立 - 分类利用各种数据挖掘模型,进行优化模型评估 - 商业目标对模型进行评价,并检查模型的每个步骤,...原创 2019-09-29 17:00:02 · 164 阅读 · 0 评论 -
数据分析(3)python科学计算:用NumPy快速处理数据
NumPy更加高效NumPy数组结构比Python本身的list更加的节省资源:列表 list 的元素在系统内存中是分散存储的,而 NumPy 数组存储在一个均匀连续的内存块中。这样数组计算遍历所有的元素,不像列表 list 还需要对内存地址进行查找,从而节省了计算资源。另外在内存访问模式中,缓存会直接把字节块从 RAM 加载到 CPU 寄存器中。因为数据连续的存储在内存中,NumPy 直接...原创 2019-10-01 11:23:03 · 430 阅读 · 3 评论 -
数据分析(4)Python科学计算:Pandas
pandas的学习分为以下方面其中进行数据统计时常用的统计函数如下数据表合并一个DataFrame相当于一个数据库的数据表,多个DataFrame数据表的合并就相当于多个数据库的表合并。两个DataFrame数据表的合并使用的是merge()函数,有下面5种形式:基于指定列进行连接inner内连接left左连接right右连接outter外连接demo:eg. 创...原创 2019-10-01 16:24:07 · 264 阅读 · 2 评论