软件构造教程（预习或复习自取四）-CSDN博客

本文链接：https://blog.csdn.net/qq_61254470/article/details/135179281

本文详细探讨了软件开发中的关键概念，如模块化构造、面向对象设计、数据处理策略（包括CSV文件和数据持久性）、健壮性与防御性编程、正则表达式以及表驱动编程。文章还涉及用户交互、软件重构、GUI设计和数据库应用等内容。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

第一章：软件开发概述

第二章：模块化软件构造

第三章：面向对象的软件构造

第四章：数据处理的软件构造

本章讨论案例中数据处理的问题:按需选择、使用数据及数据持久性。
重点是如何把算式和习题从程序变量的值转化为可共享的、持久性的文件数据;学习文件的产生、存储和读取操作，学习一个特殊的文本文件格式CSV编程方面，学习表驱动编程模式和防御性编程。
测试方面，学习白盒测试的基本技术，继续学习JUnit的其他测试方法。
实现数据持久性最基本的途径是文件和数据库。

4.1数据及其持久化

保存在程序之外(如文件、网络）的数据称为持久数据。
文件处理是编程语言支持应用程序存储和处理大量持久数据的一个最重要能力。
Java 等编程语言通常都提供了文件处理和输入/输出流的功能。

从比特到文件

字符由比特组成。
一组字符或字节组成字段，一个字段是传递含义的一组字符或字节。
若干字段构成记录，记录是一组有关系的字段。
一个文件可以是一组相关的记录。

组织文件中的记录有多种不同的方式。

最常见的方式是顺序文件。
一组相关的文件可以组成数据库。

一个应用程序如何选择数据的存储、管理和处理方式，要考虑下面的因素。

数据的持久性和使用频次
生产和访问数据的难易程度
共享与传输
数据的量及管理
数据的操作方式

4.2文件与输入/输出流

理解文件的概念及其分类
理解输入/输出流的概念及应用了解数据序列化的概念
掌握CSV格式的文本文件

4.2.1文件

案例的持久性问题，本质上是程序之间的一种交互，即一个程序或模块产生数据，另一个程序或模块读取并使用这些数据。
程序之间可以通过文件实现输入/输出。
在操作系统中，文件是组织和管理数据的基本单位，也是对物理输入/输出设备的抽象，使用者不必关心文件及其内容的存取方式、存储位置、结束标志等。

1．字符文件与字节文件

在字符文件中，字节表示字符，使得人们可以查看、编辑文件。在字节文件中，字节不一定表示字符;字节组还可以表示其他类型的数据，如整数、浮点数或汉字字符。
文件都是以二进制格式存储的。
字节文本的存储无须任何编码，而使用文本文件时要考虑字符编码。

2．记录文件和流式文件

文件分为物理文件和逻辑文件；

逻辑文件从结构上分两种:

无结构的流式文件，信息不划分单位，由一串字符流构成文件;
有结构的记录文件，信息按逻辑上独立的含义划分信息单位，称为一个逻辑记录（简称记录）。

4.2.2输入/输出流

在程序中，可以把文件理解成物理概念，流是逻辑概念。程序的输入/输出操作是针对抽象的流来定义的，前提是把该文件与一个(对象）流联系起来。
高级语言如C、C++、C#、Java 等保留了操作系统中的文件，同时引入了流，执行对文件的读/写操作。
Java 等语言没有定义文件结构，即记录，所以，程序员必须设计文件结构来满足应用的需求。

4.2.3数据序列化

1．编写数据序列化代码

“线性化”函数将结构化数据转换为字符串类型的数据。当程序需要结构化数据时，再通过“结构化”函数，把线性化的数据按照原先的数据结构恢复成结构化数据。
如何读/写对象:要把对象转换成字符串，在Java中类似toString。首先要把具有结构的数据元素分解，转换成字符串，然后用特殊分隔符隔离。每个数据对象还要再以分隔符隔离。

2．对象序列化

Java、C#等面向对象语言都有实现对象序列化的类或接口（类似Serializable )，把对象数据转换成(二进制)字节序列的形式，与外部源共享或传输数据。
程序员不必准确知道系统是如何表示对象的字节序列的。
序列化(Serialization）是将对象的状态信息（成员变量）转换为可以存储或传输的形式的过程。它的逆过程则被称为反序列化(Deserialization )。
在序列化期间，对象将其当前状态写入到临时或持久存储区。可以通过从存储区中读取或反序列化对象的状态，重新创建该对象。序列化的对象是对象的字节序列，包含对象数据及其类型信息。这样，信息可以用来再创建内存中的对象。

4.2.4 CSV格式的文本文件

逗号分隔值CSV ( Comma-Separated Values)以纯文本形式存储数字和文本数据。
CSV是一种通用的、相对简单的文本文件格式，在电子表单和数据库中有着广泛的应用.
一些程序设计语言如Java、R、Go和Python 都内置了读/写CSV格式文件的函数或类。
CSV没有单一的、明确定义的格式。

在实践中，CSV泛指具有以下特征的任何文本文件:

纯文本，使用某个字符集，如ASCII、Unicode、EBCDIC或GB2312;
由记录组成（典型的是每行一条记录）;
每条记录被分隔符分隔为字段（典型分隔符有逗号、分号或制表符;有时分隔符可以包括可选的空格）;每条记录都有同样的字段序列。

4.3编写健壮的程序

理解健壮性的概念

基本掌握防御性编程了解断言

4.3.1防御性编程

健壮性（robutness）是指程序对于要求之外的输入进行判断并处理、使程序保持运行状态，即使这有时可能导致不准确的结果。
程序的正确性指的是程序绝不产生不准确的结果。
防御性编程和断言是实现程序健壮性的技术手段。

防御性编程的基本思想:

程序员要预计程序使用者的过错、无效的输入、甚至有害的数据及使用者的过失，
即使这种事情罕见，也要采取适当措施保护自己的程序。

保护程序无效输入破坏的基本原则∶

检查每个输入参数的数据;特别要检查从程序外部进入程序的数据。
一旦发现了无效数据，就要决定处理的方式。
基本的方式有处理错误和使用异常。

1．处理错误

错误处理的方式影响软件满足正确性、健壮性及其他非功能性需求的能力。
数据错误出现时的一些建议

( 1）继续运行程序、返回中性无害的数据。
(2) 用最接近的有效数据替换无效数据。
(3) 在日志中记录警告信息并继续运行程序。
(4）调用错误处理程序或对象。
(5）屏幕显示错误信息。
(6）尽可能在局部处理错误。
(7) 返回一个错误编码，让特定程序处理这个错误。

2．使用异常

异常是处理错误的一种特殊方式，出现了错误或异常行为的程序能把错误传递给程序的调用者，让它处理。

异常处理─般有两种模型:终止模式和恢复模式。

终止模式

假设错误非常关键，导致程序无法返回到异常发生的地方继续执行。
一旦抛出异常，就表明错误已无法挽回，也不能回来继续执行。

恢复模式

认为异常处理程序的工作是修正错误，重新尝试调用出问题的方法，并认为二次处理能成功。
恢复模式希望处理异常后程序能继续执行。

4.3.2使用断言

断言：

是让程序在运行过程中自我检查的代码。
如果断言为真，就意味着程序如期望的正常;否则，就表示在代码中发现了意外。

编写代码时，我们总是会做出一些假设。断言用于在代码中捕捉这些假设。
可以将断言视为异常处理的一种高级形式。

可以使用断言在代码中记录一些假设，例如:

输入参数的值在预期范围内;
程序运行时文件流已打开或者在开始的地方;
输入参数的数组、表或其他容器已经包含了数据；
指针非空。

断言的现行形式是一些布尔表达式，程序员相信在程序中的某个特定点该表达式值为真。

断言分为如下三类：

前置断言:代码执行之前必须具备的特性。
后置断言:代码执行之后必须具备的特性。
不变断言:代码执行前后不能变化的特性。

断言的基本用途是调试和测试程序，编译器启动断言检查后才能使用断言。
程序布署完之后就关闭断言。
Java使用断言的例子:Junit

下面是使用断言的一些建议：

对预计出现的条件使用错误处理，对不应当出现的条件使用断言。
错误处理用于检查不合理的输入数据;断言则用于检查代码中的错误。
避免在断言中放置可执行的代码。因为关闭断言后，编译器可能会删除这些代码。
用断言来记录和验证前置条件和后置条件。健壮性要求高的程序同时使用断言和错误处理。

4.4字符串处理与正则

在操作文本文件时，数据都是字符串。
基本类型（如32.5）或结构化的数据（如32+5），存储在文本文件中都是字符串“32.5”和“32+5”。
字符串作为基本的内置类型，编程语言也提供了大量的字符串操作，如:查找一个字符、查找一个字串、置换一个字串、合并两个字串、字符串复制等。
自定义的数据类型或对象，则需要用户自己编写转换程序。
如，C#、Java等需要为自定义的类编写对象的字符串显示方法toString()，覆盖从根类继承的默认显示。

现代编程语言提供了更丰富的字符串处理库，其中重要而又易用的是正则表达式。

正则表达式 Regular Expressions

是一串字符，它所定义的模式可用来查找、显示或修改输入序列中出现的某个模式的一部分或全部。
Java在String类中提供了boolean matches (Stringregxep)、void replaceAll (String regxep, Stringreplacement)和String [] split(String regxep)三种基本方法，它们的作用分别是匹配、替换全部匹配内容、分割。参数都包含了正则表达式regxep。