python批量读取文件行数_Python学习教程:如何用python统计代码行数

本文介绍了一个Python脚本,该脚本能够统计Python和C系列语言代码的行数,包括代码行、空行和注释行。通过递归遍历指定目录下的所有文件,利用正则表达式匹配注释,并分别计算各类行数。最终,程序会输出每个文件及整个目录的统计结果,提供了一种自动化代码分析的方法。
摘要由CSDN通过智能技术生成

原标题:Python学习教程:如何用python统计代码行数

Python学习教程:如何用python统计代码行数

改良后的代码可以对python和C系列的代码实行行数计算,包括代码、空行和注释行,用re抓取注释,传入一个目录自动对其下的文件进行读取计算

流程

首先判断传入参数是否为文件夹,不是则打印出提示,否则继续(无返回),获得目录后,yongos.listdir对路径下文件进行遍历,其中也包含文件夹,再次判断是否为文件夹,是的话则递归调用此函数,否则开始执行行数统计,这里用os.path.join将路径与文件名进行拼接,方便之后直接传给函数,逻辑很简单,无非是执行文件判断,判断是哪类文件,在调用对应的注释监测正则代码段进行抓取,抓取到则行数+1,空白行也是一样的原理,用strip(去除前后空格),然后行内内容为空则为空行,代码段即为总行数减去其他两类行数,最后在外层将所有文件对应的代码段累加即为total

关键

函数内部是可以访问全局变量的,问题在于函数内部修改了变量,导致python认为它是一个局部变量。

所以,如果在函数内部访问并修改全局变量,应该使用关键字 global 来修饰变量

import os

import re

#定义规则抓取文件中的python注释

re_obj_py = re.compile('[(#)]')

#定义规则抓取文件中的C语言注释

re_obj_c = re.compile('[(//)(/*)(*)(*/)]')

#判断是否为python文件

def is_py_file(filename):

if os.path.splitext(filename)[1] == '.py':

return True

else:

return False

#判断是否为c文件

def is_c_file(filename):

if os.path.splitext(filename)[1] in ['.c', '.cc', '.h']:

return True

else:

return False

#定义几个全局变量用于计算所有文件总和(全部行数、代码行数、空行数、注释行数)

all_lines, code_lines, space_lines, comments_lines = 0, 0, 0, 0

#判断是否为文件夹,不是则输出提示

def count_codelines(dirpath):

if not os.path.isdir(dirpath):

print('input dir: %s is not legal!' % dirpath)

return

# 定义几个全局变量用于计算每个文件行数(全部行数、代码行数、空行数、注释行数)

global all_lines, code_lines, space_lines, comments_lines

#列出当前文件夹下的文件(包含目录)

all_files = os.listdir(dirpath)

for file in all_files:

#将文件(目录)名与路径拼接

file_name = os.path.join(dirpath, file)

if os.path.isdir(file_name):

count_codelines(file_name)

else:

temp_all_lines, temp_code_lines, temp_space_lines, temp_comments_lines = 0, 0, 0, 0

f = open(file_name)

for line in f:

temp_all_lines += 1

if line.strip() == '':

temp_space_lines += 1

continue

if is_py_file(file_name) and re_obj_py.match(line.strip()):

temp_comments_lines += 1

if is_c_file(file_name) and re_obj_c.match(line.strip()):

temp_comments_lines += 1

temp_code_lines = temp_all_lines - temp_space_lines - temp_comments_lines

print('%-15s : all_lines(%s)\t code_lines(%s)\t space_lines(%s)\t comments_lines(%s)'

% (file, temp_all_lines, temp_code_lines, temp_space_lines, temp_comments_lines))

all_lines += temp_all_lines

code_lines += temp_code_lines

space_lines += temp_space_lines

comments_lines += temp_comments_lines

if __name__ == '__main__':

count_codelines('test')

print('\n**** TOTAL COUNT ****\nall_lines = %s\ncode_lines = %s\nspace_lines = %s\ncomments_lines = %s' % (all_lines, code_lines, space_lines, comments_lines))

本期的Python学习教程先跟大家分享这么多!返回搜狐,查看更多

责任编辑:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值