数据库基础知识记录

1:常用的SQL语句

  1. SELECT: 用于从数据库中选择数据。
SELECT column1, column2 FROM table_name;
  1. INSERT INTO: 用于向数据库中插入新记录。
INSERT INTO table_name (column1, column2) VALUES (value1, value2);
  1. UPDATE: 用于更新数据库中的记录。
UPDATE table_name SET column1 = value1, column2 = value2 WHERE condition;
  1. DELETE: 用于从数据库中删除记录。
DELETE FROM table_name WHERE condition;
  1. CREATE TABLE: 用于创建新表格。
CREATE TABLE table_name (
    column1 datatype,
    column2 datatype,
    ...
);
  1. ALTER TABLE: 用于修改现有表格(如添加、删除、修改列)。
ALTER TABLE table_name ADD column_name datatype;
  1. DROP TABLE: 用于删除表格。
DROP TABLE table_name;
  1. WHERE: 用于指定条件,过滤要返回的数据。
SELECT * FROM table_name WHERE condition;
  1. GROUP BY: 用于将数据分组。
SELECT column1, COUNT(column2) FROM table_name GROUP BY column1;
  1. ORDER BY: 用于对结果进行排序。
SELECT * FROM table_name ORDER BY column1 ASC/DESC;

这些是SQL中最基本和最常用的一些语句,但SQL还有许多其他功能和语法,例如子查询、连接(JOIN)、聚合函数等,可以根据具体的需求来使用。

2:具体例子

当你需要从数据库中删除符合特定条件的记录时,你可以使用DELETE语句。以下是一个DELETE语句的具体例子:

假设有一个名为employees的表格,其中包含员工的信息,具有以下列:employee_id, first_name, last_name, department, salary。现在,假设我们需要删除部门为"HR"的所有员工记录,可以使用以下SQL语句:

DELETE FROM employees
WHERE department = 'HR';

这条SQL语句将会从employees表格中删除部门为"HR"的所有员工记录。

需要注意的是,删除操作是不可逆的,所以在执行DELETE语句之前,请确保你真正想要删除这些记录。

当你需要向数据库中插入新的记录时,你可以使用INSERT INTO语句。以下是一个INSERT INTO语句的具体例子:

假设有一个名为employees的表格,其中包含员工的信息,具有以下列:employee_id, first_name, last_name, department, salary。现在,假设我们需要向这个表格中插入一条新的员工记录,可以使用以下SQL语句:

INSERT INTO employees (employee_id, first_name, last_name, department, salary)
VALUES (101, 'John', 'Doe', 'IT', 60000);

这条SQL语句将会向employees表格中插入一条新的员工记录,该员工的员工号(employee_id)为101,名字为John,姓为Doe,所属部门为IT,薪水为60000。

需要注意的是,插入操作会改变数据库的状态,所以在执行INSERT INTO语句之前,请确保你提供了正确的数据,并且不会违反数据库的约束条件(如主键约束、唯一性约束等)。

  1. 插入一条新的员工记录到employees表中:
INSERT INTO employees (employee_id, first_name, last_name, department, salary)
VALUES (101, 'John', 'Doe', 'IT', 60000);
  1. 插入多条新的产品记录到products表中:
INSERT INTO products (product_id, product_name, category, price)
VALUES (1, 'Laptop', 'Electronics', 1000),
       (2, 'Smartphone', 'Electronics', 800),
       (3, 'Chair', 'Furniture', 50);
  1. 插入一条新的订单记录到orders表中,并使用子查询获取顾客ID:
INSERT INTO orders (order_id, customer_id, order_date, total_amount)
VALUES (101, (SELECT customer_id FROM customers WHERE customer_name = 'Alice'), '2024-03-07', 500);
  1. 插入一条新的学生记录到students表中,并使用默认值为NULL的列:
INSERT INTO students (student_id, first_name, last_name)
VALUES (1001, 'Emily', 'Smith');
  1. 插入一条新的评论记录到comments表中,并忽略重复的评论:
INSERT IGNORE INTO comments (comment_id, post_id, commenter_id, comment_text)
VALUES (101, 500, 200, 'Great post! Keep it up.');

这些例子演示了如何使用INSERT INTO语句将数据插入到数据库表中。每个例子都针对不同的情况,展示了如何插入单行或多行数据,并处理了一些特殊情况,如使用子查询、默认值、忽略重复等。

一些增删改查的具体SQL例子

当处理数据时,经常会用到增删改查(CRUD)操作,即创建(Create)、读取(Read)、更新(Update)、删除(Delete)。以下是一些具体的SQL例子:

  1. 创建(Create)
    创建一个新的表格:
CREATE TABLE employees (
    employee_id INT PRIMARY KEY,
    first_name VARCHAR(50),
    last_name VARCHAR(50),
    department VARCHAR(50),
    salary DECIMAL(10,2)
);
  1. 读取(Read)
    从employees表中选择所有员工记录:
SELECT * FROM employees;

选择特定条件下的员工记录:

SELECT * FROM employees WHERE department = 'IT';
  1. 更新(Update)
    更新employees表中员工的薪水:
UPDATE employees SET salary = 65000 WHERE employee_id = 101;
  1. 删除(Delete)
    删除employees表中特定条件下的员工记录:
DELETE FROM employees WHERE department = 'HR';

这些是增删改查(CRUD)操作的一些具体SQL例子。在实际应用中,你可以根据需求和具体情况调整和组合这些操作。

数据库的范式与其关系

关系数据库理论中,存在多个范式,常见的有以下几个:

  1. 第一范式(1NF):确保每个列具有原子性,即每个列都是不可再分的基本数据项。不允许多个值或者数组作为一个列的值,确保每个单元格只包含一个值。
  2. 第二范式(2NF):在满足第一范式的基础上,所有非主属性都完全函数依赖于候选键,即表中的每一列数据都与主键直接相关,而非部分相关。
  3. 第三范式(3NF):在满足第二范式的基础上,消除传递依赖,即所有非主属性都不依赖于其他非主属性。如果存在非主属性之间的传递依赖,应将它们分解为单独的表。
    以上是最常见的前三个范式,但在实际应用中还存在更高级的范式,如Boyce-Codd范式(BCNF)、第四范式(4NF)等。这些范式的目的是规范化数据库设计,减少数据冗余、提高数据一致性和完整性,以及简化数据更新和维护操作。

举例说明具体的范式

假设我们有一个关于学生信息的数据库,其中包含以下两个表格:

students 表格包含学生的信息:

| student_id | first_name | last_name | age | major    |
|------------|------------|-----------|-----|----------|
| 1          | John       | Doe       | 20  | Biology  |
| 2          | Alice      | Smith     | 21  | History  |
| 3          | Bob        | Johnson   | 19  | Physics  |

grades 表格包含学生的考试成绩:

| student_id | exam_name | grade |
|------------|-----------|-------|
| 1          | Midterm   | 85    |
| 1          | Final     | 90    |
| 2          | Midterm   | 75    |
| 2          | Final     | 80    |
| 3          | Midterm   | 95    |
| 3          | Final     | 85    |

现在我们来检查这些表格是否符合范式的要求。

  1. 第一范式(1NF):每个表格的每一列都是不可再分的原子值。在上述例子中,每个表格的列都满足这个条件,因此符合第一范式。
  2. 第二范式(2NF):要满足第二范式,首先需要确定每个表格的候选键。在students表格中,student_id是候选键;在grades表格中,student_id和exam_name组合在一起可以唯一确定一条记录,因此它们是候选键。由于grades表格中的每条记录都完全依赖于student_id和exam_name这两个主键,因此它满足第二范式。
  3. 第三范式(3NF):第三范式要求消除传递依赖。在上述例子中,students表格中的major字段与student_id主键直接相关,不涉及传递依赖,因此它满足第三范式。然而,grades表格中的exam_name字段与grade字段之间存在传递依赖,因为grade依赖于exam_name,而exam_name依赖于student_id。为了满足第三范式,我们应该将exam_name字段和grade字段分离出来,放入一个单独的表格中,并且与student_id形成关联。这样可以避免传递依赖,使得数据更加规范化。
    这就是一个简单的例子,说明了如何通过范式来评估数据库表格的结构,并说明了如何确保数据库的规范性和完整性。

一个不满足第一范式(1NF)的表格示例:

不满足第一范式(1NF)的表格示例:

| order_id | customer_id | product_ids        | quantities |
|----------|-------------|--------------------|------------|
| 1        | 101         | 1,2,3              | 2,1,3      |
| 2        | 102         | 2,4                | 2,1        |
| 3        | 103         | 1                  | 5          |

在这个示例中,product_ids列和quantities列包含了多个值,这违反了第一范式的要求,因为这些列不是原子值。为了符合第一范式,应该将多个值拆分成单个值,并将其存储在不同的行中。

接下来,让我们来看一个不满足第二范式(2NF)的表格示例:

不满足第二范式(2NF)的表格示例:

| order_id | product_id | product_name | category |
|----------|------------|--------------|----------|
| 1        | 1          | Laptop       | Electronics |
| 1        | 2          | Chair        | Furniture   |
| 2        | 1          | Laptop       | Electronics |
| 2        | 3          | Smartphone   | Electronics |

在这个示例中,product_name和category列与product_id列只有部分依赖关系,因为它们与order_id列一起才能唯一确定一条记录。这违反了第二范式的要求。为了符合第二范式,应该将product_name和category列移至一个独立的表格中,以便将其与product_id列分开。

这些示例说明了范式的重要性以及如何通过检查表格结构来确定其是否符合范式的要求。符合范式有助于确保数据库的规范性、完整性和一致性。

依赖关系是啥

  1. 函数依赖(Functional Dependency):在关系数据库中,如果一个数据项的值能够唯一地确定另一个数据项的值,那么就说这两个数据项之间存在函数依赖关系。例如,如果在一个关系表中,给定主键的值能够唯一确定其他非主键属性的值,则称这些非主键属性函数依赖于主键。
  2. 多值依赖(Multivalued Dependency):多值依赖是指在一个关系表中,某些属性组合的值决定了其他属性组合的值,但不是完全函数依赖于这些属性。这种依赖关系在某些情况下会导致数据冗余,因此需要进行规范化以消除这种依赖。
  3. 传递依赖(Transitive Dependency):在关系数据库中,如果一个非主键属性依赖于其他非主键属性,而这些非主键属性又依赖于主键,那么就存在传递依赖关系。这种依赖关系也可能导致数据冗余和更新异常。
    主键(Primary Key)是关系表中的一个或多个字段(列),它们的值用来唯一标识每一条记录。主键必须具有唯一性和不可变性,即表中的每个记录都必须具有唯一的主键值,且主键值不能为NULL。

主属性(Primary Attribute)通常指与主键相关联的属性,它们用来描述主键所标识的实体或事物的属性。在关系数据库中,主属性通常是与主键直接相关联的属性。例如,在一个学生信息表中,学生的学号可能是主键,而学生的姓名、性别、年龄等信息就是主属性。

数据库设计分成

数据库设计通常可以分为以下几个步骤:

  1. 需求分析
  • 确定系统或应用程序的需求,包括功能需求和数据需求。
  • 收集和分析用户需求,确定需要存储的数据和数据之间的关系。
  1. 概念设计
  • 根据需求分析阶段得到的数据需求,设计高层次的数据模型。
  • 使用实体-关系模型(ER模型)或其他概念性模型来描述数据实体、属性和实体之间的关系。
  1. 逻辑设计
  • 将概念设计转化为数据库管理系统(DBMS)可以理解和操作的逻辑模型。
  • 基于所选的数据库系统,设计逻辑模型的结构,包括表格、列、主键、外键等。
  1. 物理设计
  • 将逻辑模型转化为实际的数据库结构,确定如何在物理存储介质上组织数据。
  • 包括确定数据类型、索引、分区、存储过程、触发器等数据库对象的细节。
  1. 实施和测试
  • 根据物理设计创建数据库结构,包括表格、索引等。
  • 加载数据到数据库中,并进行测试,确保数据库能够满足需求并正常运行。
  1. 优化和维护
  • 对数据库进行优化,包括性能优化、存储空间优化等。
  • 定期进行数据库维护,包括备份、恢复、性能监控等。
    这些步骤通常是数据库设计过程中的基本流程,但实际上可能会根据项目的特定需求和情况进行调整和扩展。

ER模型

ER模型(Entity-Relationship Model)是一种用于描述实体之间关系的概念性数据模型。它用来建立现实世界中的概念模型,将现实世界中的实体(Entity)和实体之间的关系(Relationship)以及实体的属性(Attribute)进行抽象和表示。

在ER模型中,实体表示现实世界中的一个对象或事物,例如人、地点、物品等。每个实体都有一组属性,用来描述该实体的特征或属性。关系表示实体之间的联系或关联,描述实体之间的交互以及它们之间的联系方式。

ER模型使用以下几种基本符号来描述实体、属性和关系:

  • 实体(Entity):用矩形框表示,框内写实体名称。
  • 属性(Attribute):用椭圆形表示,椭圆框内写属性名称。
  • 关系(Relationship):用菱形表示,菱形内写关系名称。
  • 外键(Foreign Key):用下划线标识,表示关系中的外键。
    通过将实体、属性和关系组织在一起,ER模型可以提供对现实世界中信息的抽象表示,以便更好地理解和设计数据库结构。

ER模型是数据库设计过程中的重要工具之一,它帮助数据库设计人员在设计数据库之前对现实世界的数据进行抽象、分析和理解,并且可以作为设计关系数据库结构的基础。

数据冗余 ,更新异常,插入异常,删除异常

这些术语通常与数据库中的规范化(Normalization)和数据库设计相关。让我简要解释一下每个术语的含义:

  1. 数据冗余(Data Redundancy):指的是在数据库中存储相同或类似的数据多次,这可能会导致数据存储空间的浪费,并且增加了数据的维护和管理成本。数据冗余也可能导致数据不一致性,因为更新一个副本的数据时,其他副本的数据可能不会及时更新。
  2. 更新异常(Update Anomaly):更新异常指的是在数据库表中存在的数据更新操作的不一致性或异常。这可能会导致数据不一致或错误,因为同一个数据在不同的记录中存在多次,如果其中一个副本被更新,其他副本可能会被遗漏而导致不一致。
  3. 插入异常(Insertion Anomaly):插入异常指的是在数据库表中存在的插入新数据操作的不一致性或异常。这可能会导致无法插入新数据,因为某些必需的信息缺失,例如某个记录的主键必须在其他表格中存在对应的记录,否则无法插入该记录。
  4. 删除异常(Deletion Anomaly):删除异常指的是在数据库表中存在的删除数据操作的不一致性或异常。这可能会导致数据丢失或不一致,因为删除某些记录时可能会导致与其相关的其他记录也被误删。
    这些异常通常是由于数据库设计中存在冗余数据和不合理的表格结构所导致的。通过进行适当的数据库规范化和设计,可以减少或避免这些异常的发生,从而确保数据库的数据完整性和一致性。

主属性和主键分别是啥,有啥区别

主属性(Primary Attribute)和主键(Primary Key)是数据库中的两个不同概念,它们具有以下区别:

  1. 主属性(Primary Attribute)
  • 主属性是指与实体关联的属性,即描述实体的特征或属性的属性。
  • 主属性是实体的一部分,用来标识实体的某个特征。
  • 主属性不一定是唯一的,可以出现在多个实体中,而且不一定具有唯一性。
  • 例如,在一个学生信息表中,学生的姓名、性别、年龄等信息就是主属性。
  1. 主键(Primary Key)
  • 主键是一种特殊的属性,用来唯一标识关系表中的每一条记录
  • 主键具有唯一性不可变性,意味着表中的每个记录都必须具有唯一的主键值,且主键值不能为NULL
  • 主键用来确保数据的唯一性和一致性,作为记录的唯一标识符。
  • 主键通常是一个或多个属性的组合,用来唯一标识一条记录。
  • 例如,在一个学生信息表中,学生的学号可能是主键。
    总结来说,主属性是描述实体特征的属性,而主键是关系表中记录的唯一标识符。主属性可以是实体的任何属性,而主键是一种特殊的属性或属性组合,用来确保关系表中记录的唯一性。

候选键是啥

候选键(Candidate Key)是在关系数据库中能唯一标识每一条记录的属性或属性组合。候选键的选取基于数据的实际业务需求,并且必须满足以下两个条件:

  1. 唯一性(Uniqueness):候选键的属性或属性组合必须能够唯一标识每一条记录,即不存在两条记录具有相同的候选键值。
  2. 最小性(Minimality):候选键的属性或属性组合不能再减少任何属性,即去掉任何一个属性都无法保证唯一性。
    候选键与主键的区别在于,主键是从候选键选取的一组属性作为唯一标识符,用来作为关系表中记录的唯一标识,而候选键是可能作为主键的候选项,可能有多个候选键但只能选择一个作为主键。

举个例子,考虑一个学生信息表,其中包含学生编号、学生姓名和学生邮箱。在这个表中,学生编号和学生邮箱都能够唯一标识每一条记录,因此它们都是候选键。然而,最终选择学生编号作为主键,因为它更简洁、更稳定。

不同范式对主键和候选键的要求略有不同,下面是各个范式对主键和候选键的一般要求:

  1. 第一范式(1NF)
  • 第一范式不直接涉及主键和候选键的要求,而是确保每个单元格只包含一个值,确保表格中的数据是原子的。
  1. 第二范式(2NF)
  • 第二范式要求表格必须符合第一范式,并且非主属性完全依赖于候选键。这意味着候选键的每一个属性都必须直接关联到非主属性,不能有部分依赖。
  1. 第三范式(3NF)
  • 第三范式要求表格必须符合第二范式,并且消除传递依赖。这意味着非主属性之间不能有传递依赖关系。
  1. Boyce-Codd范式(BCNF)
  • Boyce-Codd范式是对第三范式的进一步限制,它要求每一个非平凡依赖关系的左部(决定因素)都必须是候选键。换句话说,每个非平凡依赖关系都必须是一个候选键的函数依赖。
  1. 第四范式(4NF)
  • 第四范式要求表格必须符合第三范式,并且没有多值依赖关系。这意味着候选键中的每一个属性都不能决定其他非键属性的多个值。
    不同范式对主键和候选键的要求主要体现在关系表格的设计和规范化过程中,以确保数据的规范性、完整性和一致性。
  • 28
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Visual FoxPuo 程序设计基础 第1章 数据库系统基础知识 数据库基础知识 1.1 数据模型 1.2 数据库系统 1.3 关系数据库 1.4 数据库系统的体系结构与开发工具 1.5 1.1 数据库基础知识 通常,把用计算机对数据进行处理的应用 系统称为计算机信息系统,其核心是数据库。 本节将介绍数据库中的一些基本知识。 1.1.1 信息与数据 信息具有如下重要特征。 (1)信息具有征性。 它能够达事物的属性、运动特征及状态。 (2)信息具有可传播性。 信息可以进行获取、存储、传递和共享。 (3)信息具有可处理性。 信息可以进行压缩、加工以及再生。 (4)信息具有价值性和可转换性。 与信息相关的是数据。 数据是信息的具体现形式,是信息的 载体。 在实际应用中,数据的示形式有两种: 一种是可以参与数值运算的数值型数据,如 示工资、成绩的数据;另一种是由不能参与数 值运算的数据,如字符(文字和符号)、图 (图形、图像和格)、动画、影像、声音等 多媒体数据。 数据有两方面的特征:一是客体属性的 反映,这是数据的内容;二是记录信息的 符号,这是数据的形式。 形式是内容的现方式,内容是形式的 实质。 1.1.2 数据处理 数据处理是指将数据转换成信息的过 程,数据处理也可称为信息处理。 它包括对数据的采集、整理、存储、 分类、检索、排序、统计、维护、传输等一 系 列活动。 通常将数据处理分为两个操作层次:一 是数据采集、分类、组织、编码、存储、检 索、传输、维护等基本操作,这些基本操作 称为数据管理;二是加工、计算、输出等操 作,管理对象不同,操作的要求也不同。 根据处理设备的结构和工作方式以及数 据分布方式的不同,数据处理的方式主要有 以下4种。 (1)按处理设备的结构方式分,可分 为联机处理方式和脱机处理方式。 (2)按数据处理时间的分配方式分, 可分为批处理方式、分时处理方式和实 时处理方式。 (3)按数据处理空间的分布方式分,可 分为集中式处理方式和分布处理方式。 (4)按计算机中央处理器的工作方式分, 可分为单道作业处理方式、多道作业处理 方式和交互式处理方式。 1.1.3 数据库管理技术的发展 1.数据库的概念 数据库(DataBase)是依照某种数据 模型组织起来的、相互关联的、并存放于 二级存储器中的数据集合。 由于数据库本身的数据结构特征,使 得数据库独立于使用它的应用程序,对数 据的增加、删除、修改和检索则由相关的 软件进行管理和控制,从而实现了数据和 操作的分离。 将所有数据集中存放在数据库中,一方 面便于人们对其进行统一管理,另一方面也 便于人们提炼出对决策有用的数据和信息。 2.数据库的产生 实际上,数据库系统并不是和计算机 同时出现的,而是随着计算机硬件技术和 软件技术的发展,以及社会对数据处理需 求的不断发展而产生的。 计算机数据管理的方式也在不断改进, 经历了从人工管理到文件系统再到数据库 系统3个阶段。 (1)人工管理阶段。 20世纪50年代中期以前,计算机主要用 于科学计算,数据量较少,一般不需要长 期保存。 该阶段主要存在以下几方面的问题。 数据不能长期保存。 数据不独立。 数据不能重复使用。 (2)文件系统阶段。 20世纪50年代后期到60年代中期,计 算机开始大量用于数据管理。 文件系统提供了在外存储器上长期保存 数据并对数据进行存取的手段。 文件的逻辑结构与存储结构有一定的区 别,即程序与数据具有一定的独立性。 数据的存储结构变化,不一定影响程 序,因此程序员可集中精力进行算法的设 计,大大减少了维护程序的工作量。 文件系统阶段存在着以下几个问题。 数据冗余度大。 数据独立性差。 缺乏对数据的集中管理。 (3)数据库系统阶段。 20世纪60年代后期,随着计算机技术的 发展,计算机在管理中应用越来越广泛,规 模越来越庞大,数据量急剧增加,数据共享 性更强。 在数据库系统中,有一种叫做数据库 管理系统(DataBase Mannagement System, DBMS)的系统软件将所有的数 据集中到一个数据库中,形成一个数据中 心,对数据进行统一的控制。 3.数据库的特点 数据库具有数据共享、数据独立、最 小冗余、数据安全、数据完整、灵活性、 可恢复性等特点。 (1)数据共享。 (2)数据独立性强。 (3)数据冗余度小。 (4)数据结构化。 1.2 数 据 模 型 数据模型是描述数据及数据之间联系 的结构形式,它主要研究如何组织数据库 中的数据,这是数据库的核心内容。 1.2.1 基本概念 人们把客观存在的事物以数据的形式 存储到计算机中,经历了对现实生活中事 物特征的认识、概念化到计算机数据库里 的具体示形式的逐级抽象过程。 实体模型也称概念模型或信息模型, 它是按用户

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值