JAVA开发（手工处理数据库表数据的一些示例算法）

奋力向前123

已于 2024-01-03 14:02:57 修改

阅读量1k

点赞数 2

分类专栏：数据库文章标签：数据库 sql mysql

于 2023-05-31 11:02:42 首次发布

本文链接：https://blog.csdn.net/dongjing991/article/details/130963919

版权

数据库专栏收录该内容

19 篇文章 1 订阅

订阅专栏

文章详细介绍了在项目开发中处理数据库数据的步骤，包括数据统计、备份、去重和使用存储过程进行复杂操作。通过创建临时表、使用存储过程和去重操作来优化数据管理，强调了备份的重要性以及存储过程在提高效率和安全性上的作用。

摘要由CSDN通过智能技术生成

背景：

在项目开发中，有时候需要手动处理一下数据库表的数据。涉及到数据得到备份、恢复，清洗，计算，合并等操作。

举例记录一下最近对数据的一些处理过程。

1、对数据表进行数据量统计

select count(*) from  table_a;

2、记住数据库表的数据，然后进行备份

create table table_a_bak as  select * from  table_a where  1 = 1;

3、我们再对数据进行处理之前一定记得进行备份，以防错误的操作后能将数据恢复，或最大程度的恢复，这是一个好习惯。然后我们才开始对数据进行处理。

4、建立一个临时表导入需要处理的数据。一般临时表最好是 tmp_开头，这也是一个好习惯，方便数据计算完后，对临时表进行删除，以免误删。

create table  tmp_table_a as  select * from  table_a where 1 = 2;

5、对表数据进行去重的操作，先查询看看有多少手机号重复的记录。

select count(1)  from  (
select  phone ,count(1) cn  from  table_a where  phone is  not  null   group  by phone ) t where t.cn > 1  ;

6、多数据进行去重。先对table_a表进行接收

drop  table  tmp_table_a_1;
create  table  tmp_table_a_1 as
select * from  (
select  phone ,count(1) cn  from  table_a  where  phone is  not  null   group  by phone ) t where t.cn > 1  ;

7、tmp_table_a_1增加一个自增的id字段，先建立一个SEQUENCE

CREATE SEQUENCE tmp_table_a_id_seq
START WITH 1
INCREMENT BY 1
NO MINVALUE
NO MAXVALUE
CACHE 1;

给id增加自增约束

alter table tmp_table_a_1 alter column id set default nextval('tmp_table_a_id_seq');

8、将数据重新插回tmp_table_a_1 ，先清空tmp_table_a_1

清空数据

truncate table tmp_table_a_1 ;

插回数据

INSERT INTO tmp_table_a_1 
( user_id, phone, user_name, id_card, wx_account, state, app_id, app_name, head_icon, sex, sex_name, reg_time, user_state, user_state_name, open_id, opt_user, birthday_type, birthday, org_name, last_trading_time, org_code, union_id, orig_phone, update_time, belong_code, belong_name, data_type, client_num, client_name, country_code, inviter, channel_id, channel_name, company)
select  user_id, phone, user_name, id_card, wx_account, state, app_id, app_name, head_icon, sex, sex_name, reg_time, user_state, user_state_name, open_id, opt_user, birthday_type, birthday, org_name, last_trading_time, org_code, union_id, orig_phone, update_time, belong_code, belong_name, data_type, client_num, client_name, country_code, inviter, channel_id, channel_name, company
from  table_a;

9、去重操作

DELETE FROM tmp_table_a_1
WHERE id
NOT IN (
SELECT max(id)
FROM tmp_table_a_1
GROUP BY  phone
);

10、A表中有但是B表中没有的数据

drop table if exists tmp_table_a_2;
create table tmp_table_a_2 as
select  t1.* from tmp_table_a_1 t1
left join tmp_table_b_1 t2
on t1.phone = t2.phone
where t2.phone is null;

MySQL 存储过程是一组为了完成特定功能的 SQL 语句集合。你可以将存储过程看作是一个在数据库中存储的脚本，它可以被多次调用，并在需要时执行。存储过程可以包含逻辑控制语句和数据操作语句，可以接受参数、返回单个或多个结果，也可以不返回任何结果。

存储过程的基本语法

创建存储过程

sql复制代码

	`DELIMITER //`
	`CREATE PROCEDURE procedure_name([parameters])`
	`BEGIN`
	`-- SQL语句`
	`END //`
	`DELIMITER ;`

其中，DELIMITER 是用来改变SQL语句的结束符的。因为存储过程中可能包含多条 SQL 语句，所以我们需要改变默认的结束符（;）以避免冲突。
2. 调用存储过程

sql复制代码

CALL procedure_name(arguments);

查看存储过程

使用 SHOW CREATE PROCEDURE procedure_name; 可以查看存储过程的定义。
4. 删除存储过程

sql复制代码

DROP PROCEDURE IF EXISTS procedure_name;

存储过程的参数类型

IN：输入参数，表示该参数的值必须在调用存储过程时指定，在存储过程中修改该参数的值不会被返回。
OUT：输出参数，可以在存储过程中改变其值，并可返回。
INOUT：输入输出参数，调用时指定，并且可被改变和返回。

存储过程的优点

代码重用：存储过程只需要编写一次，然后可以在多个地方多次调用。
性能优化：MySQL 会对存储过程进行编译和优化，提高执行效率。
安全性：可以通过权限设置来限制对数据的访问，只允许用户通过特定的存储过程来访问数据。
减少网络通信：多个 SQL 语句可以在一个存储过程中执行，从而减少客户端和服务器之间的通信次数。
更好的错误处理：可以使用 TRY...CATCH 来处理执行过程中可能出现的错误。

示例：一个简单的存储过程

下面是一个简单的存储过程示例，该存储过程接受一个参数（学生ID），并返回该学生的姓名和年龄。

sql复制代码

	`DELIMITER //`
	`CREATE PROCEDURE GetStudentInfo(IN student_id INT, OUT student_name VARCHAR(100), OUT student_age INT)`
	`BEGIN`
	`SELECT name, age INTO student_name, student_age FROM students WHERE id = student_id;`
	`END //`
	`DELIMITER ;`

调用这个存储过程的示例：

sql复制代码