- 博客(10)
- 资源 (3)
- 收藏
- 关注
转载 大数据经典案例
目录啤酒与尿布数据新闻让英国撤军Google成功预测冬季流感大数据与乔布斯癌症治疗奥巴马大选连任成功微软大数据成功预测奥斯卡21项大奖超市预知高中生顾客怀孕意料之外:胸部最大的是新疆妹子近两年,“大数据”这个词越来越为大众所熟悉,“大数据”一直是以高冷的形象出现在大众面前,面对大数据,相信许多人都一头雾水。下面我们通过十个经典案例,让大家实打实触摸一把“大数据”...
2018-11-29 09:59:11 3020
原创 ER建模工具《ERDPlus》使用说明
目录注册账号简单介绍使用方法实体属性关系转换在ER数据建模工具里面介绍了几种ER建模的工具,这里主要介绍下ERDPlus使用方法注册账号首先进入网址:https://erdplus.com/#/注册一个自己的账号,邮箱就可以了简单介绍页面首页就有简单的教程在页面的右上角有Diagrams选项,点击打开左上角点击+new可以新建一个文件...
2018-11-27 22:31:53 3719 7
原创 ER数据建模工具
目录PowerDesignerER/StudioMySQL WorkbenchERD当今的商业决策对基于天的数据依赖越来越强烈。然而,正确而连贯的数据流对商业用户做出快速、灵活的决策起到决定性的作用。建立正确的数据流和数据结构才能保证最好的结果。这个过程叫做数据建模。为了避免认为错误并且加快进度,我们需要使用专业的软件来帮助我们建立数据逻辑模型和物理模型、生成DDL,并且能够生...
2018-11-22 18:18:55 7214 1
原创 数据库关系建模(ER图设计关系表)
目录一、概述二、基本概念1. 关系(relation)2. 列(column)3. 行(row)4. 关系表 VS 一般的表5. 主码(主键primary key)6. 实体完整性约束(entity integrity constraint)7. 外码(外键foreign key)8. 参照完整性约束(reference integrity c...
2018-11-21 20:22:46 60144 2
原创 ER建模介绍
目录基本概念1. 实体(entity)2.属性(attribute)3. 联系(relation)扩展概念1. 复合属性(composite attribute)2. 多值属性(multivalued attribute)3. 派生属性(derives attribute)4. 可选属性(optional attribute)5. 联系的进一步描述6....
2018-11-16 21:58:48 8630 1
原创 数据库范式(NF)
目录 基础知识函数依赖1NF 第一范式2NF 第二范式3NF 第三范式BCNF 鲍依斯-科得范式四种范氏之间的关系基础知识实体:现实世界中客观存在并可以被区别的事物。比如“一个学生”、“一本书”、“一门课”等等。值得强调的是这里所说的“事物”不仅仅是看得见摸得着的“东西”,它也可以是虚拟的,比如说“老师与学校的关系”。属性:教科书上解释为:“实体所具有的...
2018-11-15 16:49:07 2660 2
原创 CART算法解读
目录算法解读实例对比过程总结python实战数据处理画图预测验证参数解释数据挖掘十大算法之一1、算法解读CART分类树用的是另外一个指标 – 基尼指数. 假设一共有K个类,样本属于第k类的概率是pk,则概率分布的基尼指数定义为:基尼系数类似于熵,选择最佳划分的度量通常是根据划分后子女结点不纯性的程度。不纯的程度越低,类分布就越倾斜。例如,类分布为...
2018-11-10 16:31:56 3049
原创 c4.5算法解读
目录一、熵的认识1、熵的概念2、信息熵公式推导二、ID3ID3过程:实例论证总结ID3缺点:三、C4.5C4.5算法优缺点分析C4.5算法是用于生成决策树的一种经典算法,是ID3算法的一种延伸和优化。所以要介绍C4.5算法,就要把ID3,以及ID3中设计的熵的概念一起进行讲解。关于熵的概念在溯源探幽--熵的世界文章中做了很详细的介绍,所以...
2018-11-09 20:33:24 4808 1
原创 聚类算法(4)--Hierarchical clustering层次聚类
目录一、层次聚类1、层次聚类的原理及分类2、层次聚类的流程3、层次聚类的优缺点二、python实现1、sklearn实现2、scipy实现树状图分类判断一、层次聚类1、层次聚类的原理及分类1)层次法(Hierarchicalmethods)先计算样本之间的距离。每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个...
2018-11-07 17:45:47 71349 9
原创 聚类算法(3)--DBSCAN
目录1、基本概念2、DBSCAN聚类算法原理的基本要点3、工作流程4、sklearn 参数设置5、实例python实现6、总结:DBSCAN:基本概念:(Density-Based Spatial Clustering of Applications with Noise)它是一种基于高密度连通区域的、基于密度的聚类算法,能够将具有足够高密度的区域划分为簇...
2018-11-03 10:10:29 8270 1
Attention Is All You Need论文
2024-07-04
diabetes_train.txt
2020-05-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人