自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (3)
  • 收藏
  • 关注

转载 大数据经典案例

目录啤酒与尿布数据新闻让英国撤军Google成功预测冬季流感大数据与乔布斯癌症治疗奥巴马大选连任成功微软大数据成功预测奥斯卡21项大奖超市预知高中生顾客怀孕意料之外:胸部最大的是新疆妹子近两年,“大数据”这个词越来越为大众所熟悉,“大数据”一直是以高冷的形象出现在大众面前,面对大数据,相信许多人都一头雾水。下面我们通过十个经典案例,让大家实打实触摸一把“大数据”...

2018-11-29 09:59:11 3009

原创 ER建模工具《ERDPlus》使用说明

目录注册账号简单介绍使用方法实体属性关系转换在ER数据建模工具里面介绍了几种ER建模的工具,这里主要介绍下ERDPlus使用方法注册账号首先进入网址:https://erdplus.com/#/注册一个自己的账号,邮箱就可以了简单介绍页面首页就有简单的教程在页面的右上角有Diagrams选项,点击打开左上角点击+new可以新建一个文件...

2018-11-27 22:31:53 3687 7

原创 ER数据建模工具

目录PowerDesignerER/StudioMySQL WorkbenchERD当今的商业决策对基于天的数据依赖越来越强烈。然而,正确而连贯的数据流对商业用户做出快速、灵活的决策起到决定性的作用。建立正确的数据流和数据结构才能保证最好的结果。这个过程叫做数据建模。为了避免认为错误并且加快进度,我们需要使用专业的软件来帮助我们建立数据逻辑模型和物理模型、生成DDL,并且能够生...

2018-11-22 18:18:55 7211 1

原创 数据库关系建模(ER图设计关系表)

目录一、概述二、基本概念1. 关系(relation)2. 列(column)3. 行(row)4. 关系表 VS 一般的表5. 主码(主键primary key)6. 实体完整性约束(entity integrity constraint)7. 外码(外键foreign key)8. 参照完整性约束(reference integrity c...

2018-11-21 20:22:46 60051 2

原创 ER建模介绍

目录基本概念1. 实体(entity)2.属性(attribute)3. 联系(relation)扩展概念1. 复合属性(composite attribute)2. 多值属性(multivalued attribute)3. 派生属性(derives attribute)4. 可选属性(optional attribute)5. 联系的进一步描述6....

2018-11-16 21:58:48 8619 1

原创 数据库范式(NF)

目录 基础知识函数依赖1NF 第一范式2NF 第二范式3NF 第三范式BCNF 鲍依斯-科得范式四种范氏之间的关系基础知识实体:现实世界中客观存在并可以被区别的事物。比如“一个学生”、“一本书”、“一门课”等等。值得强调的是这里所说的“事物”不仅仅是看得见摸得着的“东西”,它也可以是虚拟的,比如说“老师与学校的关系”。属性:教科书上解释为:“实体所具有的...

2018-11-15 16:49:07 2653 2

原创 CART算法解读

目录算法解读实例对比过程总结python实战数据处理画图预测验证参数解释数据挖掘十大算法之一1、算法解读CART分类树用的是另外一个指标 – 基尼指数. 假设一共有K个类,样本属于第k类的概率是pk,则概率分布的基尼指数定义为:基尼系数类似于熵,选择最佳划分的度量通常是根据划分后子女结点不纯性的程度。不纯的程度越低,类分布就越倾斜。例如,类分布为...

2018-11-10 16:31:56 3046

原创 c4.5算法解读

目录一、熵的认识1、熵的概念2、信息熵公式推导二、ID3ID3过程:实例论证总结ID3缺点:三、C4.5C4.5算法优缺点分析C4.5算法是用于生成决策树的一种经典算法,是ID3算法的一种延伸和优化。所以要介绍C4.5算法,就要把ID3,以及ID3中设计的熵的概念一起进行讲解。关于熵的概念在溯源探幽--熵的世界文章中做了很详细的介绍,所以...

2018-11-09 20:33:24 4805 1

原创 聚类算法(4)--Hierarchical clustering层次聚类

目录一、层次聚类1、层次聚类的原理及分类2、层次聚类的流程3、层次聚类的优缺点二、python实现1、sklearn实现2、scipy实现树状图分类判断一、层次聚类1、层次聚类的原理及分类1)层次法(Hierarchicalmethods)先计算样本之间的距离。每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个...

2018-11-07 17:45:47 71319 9

原创 聚类算法(3)--DBSCAN

目录1、基本概念2、DBSCAN聚类算法原理的基本要点3、工作流程4、sklearn 参数设置5、实例python实现6、总结:DBSCAN:基本概念:(Density-Based Spatial Clustering of Applications with Noise)它是一种基于高密度连通区域的、基于密度的聚类算法,能够将具有足够高密度的区域划分为簇...

2018-11-03 10:10:29 8266 1

Attention Is All You Need论文

"Attention Is All You Need" 论文的详细解读如下: 1. 摘要(Abstract): 论文摘要简要介绍了Transformer模型,一种基于注意力机制的序列到序列学习模型。摘要提到,Transformer摒弃了传统的循环和卷积层,完全依赖于注意力机制来实现输入和输出序列之间的关联。实验结果表明,在翻译质量、并行能力和所需训练时间方面,Transformer优于此前的方法。 2. 引言(Introduction): 引言部分首先回顾了传统的序列到序列模型,特别是基于RNN和CNN的模型,并指出了它们在处理长距离依赖和并行计算方面的局限性。随后,作者介绍了注意力机制,并强调了其在机器翻译等任务中的重要性。最后,作者总结了Transformer模型的主要特点和实验结果,指出其在翻译质量和模型效率方面的优势。 3. 相关工作(Background): 在这一部分,作者简要回顾了与Transformer模型相关的先前工作,包括传统的序列到序列模型、基于注意力机制的模型以及一些优化技术。这些工作为Transformer模型的设计提供了理论基础和实践经验。

2024-07-04

RAG技术知识图谱概览

RAG技术知识

2024-05-22

RNN循环神经网络代码

RNN循环神经网络代码

2024-02-28

回归样本数据(教育年限与收入关系)

回归样本数据(教育年限与收入关系)

2023-01-10

时间序列样例数据(股票数据)

时间序列样例数据(股票数据) 可用于时间序列分析进行测试 时间颗粒度为“天” 包含每一天的开盘价、收盘价、最低值、最高值

2023-01-04

iris鸢尾花数据集下载

鸢尾花数据

2022-01-17

orange中文版.txt

orange中文版

2022-01-17

diabetes_train.txt

糖尿病数据集,主要用于机器学习或者深度学习分类算法,共有9个字段 前8个维变量,最后一个字段为标签,为二分类数据集,当然自己可以转换成ONE-HOT类型

2020-05-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除