练习题：75-CSDN博客

本文链接：https://blog.csdn.net/shangzhiqi/article/details/146002110

Python题目

题目

统计一个文本文件中的行数。

题目分析

需求理解

本题要求使用 Python 编写程序来统计一个文本文件中的行数。具体来说，需要通过 Python 代码打开指定的文本文件，逐行读取文件内容，并对读取的行数进行计数，最终输出该文件的总行数。

关键知识点

文件操作：在 Python 中，要操作文件，首先需要使用 open() 函数打开文件。open() 函数会返回一个文件对象，通过这个对象可以对文件进行读取、写入等操作。文件操作完成后，需要使用 close() 方法关闭文件，以释放系统资源。为了避免手动管理文件的关闭，可以使用 with 语句，它会在代码块执行完毕后自动关闭文件。
逐行读取文件：可以使用文件对象的 readlines() 方法一次性读取文件的所有行，将其存储为一个列表，列表中的每个元素就是文件的一行；也可以使用 for 循环逐行读取文件内容，这种方式更节省内存，尤其适用于处理大文件。
计数操作：需要使用一个变量来记录文件的行数，在读取每一行时，对该变量进行累加操作。

实现思路分析

打开文件：使用 open() 函数或 with 语句打开指定的文本文件，获取文件对象。
逐行读取文件并计数：可以选择使用 readlines() 方法读取所有行，然后统计列表的长度；也可以使用 for 循环逐行读取文件内容，每读取一行，行数计数器加 1。
关闭文件（若未使用 with 语句）：如果没有使用 with 语句，需要在读取完文件后使用 close() 方法关闭文件。
输出结果：输出统计得到的文件行数。

复杂度分析

时间复杂度：无论使用哪种方式读取文件，都需要遍历文件中的每一行，因此时间复杂度为 \(O(n)\)，其中 n 是文件的行数。
空间复杂度：如果使用 readlines() 方法，需要将文件的所有行存储在一个列表中，空间复杂度为 \(O(n)\)；如果使用 for 循环逐行读取，只需要使用常数级的额外空间，空间复杂度为 \(O(1)\)。

可能遇到的问题及注意事项

文件路径问题：确保提供的文件路径是正确的，包括文件名和文件所在的目录。如果文件不在当前工作目录下，需要提供完整的文件路径。
文件编码问题：在打开文件时，需要指定正确的文件编码，否则可能会出现编码错误。常见的文件编码有 utf-8、gbk 等。
文件不存在问题：如果指定的文件不存在，open() 函数会抛出 FileNotFoundError 异常，需要进行异常处理。

代码实现

方法一：使用 `readlines()` 方法

try:
    # 以只读模式打开文件，指定编码为 UTF-8
    with open('test.txt', 'r', encoding='utf-8') as file:
        # 读取文件的所有行，返回一个列表
        lines = file.readlines()
        # 统计列表的长度，即文件的行数
        line_count = len(lines)
        print(f"文件的行数为: {line_count}")
except FileNotFoundError:
    print("指定的文件未找到，请检查文件路径和文件名。")

代码解释：

使用 with 语句打开 test.txt 文件，以只读模式（'r'）和 utf-8 编码打开，这样可以确保正确处理包含各种字符的文本文件。with 语句会在代码块结束后自动关闭文件。
file.readlines() 方法会将文件的所有行读取到一个列表中，每一行作为列表的一个元素。
通过 len(lines) 计算列表的长度，也就是文件的行数。
使用 try-except 块捕获 FileNotFoundError 异常，如果文件不存在，会输出相应的错误提示。

方法二：使用 `for` 循环逐行读取

try:
    line_count = 0
    # 以只读模式打开文件，指定编码为 UTF-8
    with open('test.txt', 'r', encoding='utf-8') as file:
        # 逐行遍历文件
        for line in file:
            # 每读取一行，行数计数器加 1
            line_count = line_count + 1
    print(f"文件的行数为: {line_count}")
except FileNotFoundError:
    print("指定的文件未找到，请检查文件路径和文件名。")

代码解释：

初始化一个变量 line_count 用于记录行数，初始值为 0。
使用 with 语句打开文件，然后使用 for 循环逐行遍历文件内容。每遍历一行，line_count 就加 1。
最后输出统计得到的行数。同样使用 try-except 块处理文件不存在的异常。

方法三：使用 `enumerate()` 函数

try:
    # 以只读模式打开文件，指定编码为 UTF-8
    with open('test.txt', 'r', encoding='utf-8') as file:
        # 使用 enumerate 函数遍历文件，同时获取行号
        for line_number, _ in enumerate(file, start=1):
            pass
        print(f"文件的行数为: {line_number}")
except FileNotFoundError:
    print("指定的文件未找到，请检查文件路径和文件名。")

代码解释：

enumerate() 函数用于将一个可迭代对象（这里是文件对象）组合为一个索引序列，同时列出数据和数据下标。start=1 表示行号从 1 开始计数。
在 for 循环中，_ 是一个占位符，表示我们不关心具体的行内容，只关心行号。
循环结束后，line_number 就是文件的最后一行的行号，也就是文件的总行数。同样使用 try-except 块处理文件不存在的异常。

运行思路

方法一：使用 `readlines()` 方法

try:
    with open('test.txt', 'r', encoding='utf-8') as file:
        lines = file.readlines()
        line_count = len(lines)
        print(f"文件的行数为: {line_count}")
except FileNotFoundError:
    print("指定的文件未找到，请检查文件路径和文件名。")

代码运行步骤及思路

异常处理与文件打开：
- 程序进入 try 块，尝试执行其中的代码。
- with open('test.txt', 'r', encoding='utf-8') as file: 语句以只读模式（'r'）和 utf - 8 编码打开 test.txt 文件。with 语句会创建一个上下文环境，在这个环境中，文件对象 file 被正确初始化。如果文件不存在，会抛出 FileNotFoundError 异常，程序会跳转到 except 块执行相应的错误提示。
读取文件所有行：
- lines = file.readlines() 调用文件对象的 readlines() 方法，该方法会将文件中的所有行读取出来，并存储在一个列表中。列表中的每个元素对应文件中的一行文本。
统计行数：
- line_count = len(lines) 使用 len() 函数计算列表 lines 的长度，这个长度就是文件的行数，将结果存储在 line_count 变量中。
输出结果：
- print(f"文件的行数为: {line_count}") 使用格式化字符串输出统计得到的文件行数。
异常处理：
- 如果在 try 块中出现 FileNotFoundError 异常，程序会执行 except 块中的代码，输出错误提示信息。

方法二：使用 `for` 循环逐行读取

try:
    line_count = 0
    with open('test.txt', 'r', encoding='utf-8') as file:
        for line in file:
            line_count = line_count + 1
    print(f"文件的行数为: {line_count}")
except FileNotFoundError:
    print("指定的文件未找到，请检查文件路径和文件名。")

代码运行步骤及思路

初始化计数器：
- line_count = 0 初始化一个变量 line_count 用于记录文件的行数，初始值为 0。
异常处理与文件打开：
- 进入 try 块，使用 with 语句以只读模式和 utf - 8 编码打开 test.txt 文件。同样，如果文件不存在，会触发 FileNotFoundError 异常并跳转到 except 块。
逐行读取文件并计数：
- for line in file: 使用 for 循环逐行遍历文件对象 file。每读取一行，line_count 变量的值加 1。这种方式是逐行处理，不需要将整个文件内容加载到内存中，适合处理大文件。
输出结果：
- 循环结束后，print(f"文件的行数为: {line_count}") 输出统计得到的文件行数。
异常处理：
- 若出现 FileNotFoundError 异常，执行 except 块中的错误提示代码。

方法三：使用 `enumerate()` 函数

try:
    with open('test.txt', 'r', encoding='utf-8') as file:
        for line_number, _ in enumerate(file, start=1):
            pass
        print(f"文件的行数为: {line_number}")
except FileNotFoundError:
    print("指定的文件未找到，请检查文件路径和文件名。")

代码运行步骤及思路

异常处理与文件打开：
- 进入 try 块，使用 with 语句以只读模式和 utf - 8 编码打开 test.txt 文件。若文件不存在，会抛出 FileNotFoundError 异常并进入 except 块。
使用 enumerate() 函数遍历文件：
- for line_number, _ in enumerate(file, start=1): 使用 enumerate() 函数对文件对象 file 进行遍历。enumerate() 函数会将文件的每一行与一个行号关联起来，start = 1 表示行号从 1 开始计数。_ 是一个占位符，表示我们不关心具体的行内容，只关注行号。
获取最后一行的行号：
- 循环结束后，line_number 变量存储的是文件最后一行的行号，也就是文件的总行数。
输出结果：
- print(f"文件的行数为: {line_number}") 输出统计得到的文件行数。
异常处理：
- 若出现 FileNotFoundError 异常，执行 except 块中的错误提示代码。

结束语

通过对这三种统计文本文件行数方法的学习和实践，你已经掌握了在 Python 中处理文件并进行行数统计的多种技巧。无论是使用 readlines() 方法一次性读取所有行，还是利用 for 循环逐行处理，亦或是借助 enumerate() 函数巧妙计数，每种方法都有其独特的优势和适用场景。

在实际编程中，处理文件是一项常见且重要的任务。当面对小文件时，readlines() 方法简洁直观；而处理大文件时，逐行读取的方式能有效节省内存。enumerate() 函数则为我们提供了一种更具 Python 风格的计数方式。

希望你能将这些知识灵活运用到更多的文件处理场景中，不断探索 Python 文件操作的更多可能性。编程是一个充满挑战与惊喜的领域，每一次的实践都是成长的机会。保持这份对编程的热情，继续深入学习，你将在 Python 的世界里创造出更多精彩的代码。