西电Lgx老师python上机任务1-5-文件编解码

 python作业:编写程序,用户在命令提示行输入文件名和该文件的编码格式,读入文件,将其转存成UTF-8格式。如果用户没有指定输入文件的编码格式,则使用chardet模块“猜”出其编码格式,用于解码。使用argparse模块解析用户命令提示行输入。

调查资料和解:

1、argparse模块是用于给用户提供命令行选项和参数解析的模块

# 1导入模块
import argparse
# 2.建立解析对象
parser=argparse.ArgumentParser()
# 3.增加属性,添加帮助,指定类型为int
parser.add_argument("square",help="To square the number given",type=int)
# 4实例化对象 args
args=parser.parse_args()
 
# 5打印参数echo
print(args.square**2)

2、if__name__=='__main__':

通俗的理解__name__ == '__main__':假如你叫小明.py,在朋友眼中,你是小明(__name__ == '小明');在你自己眼中,你是你自己(__name__ == '__main__')

if __name__ == '__main__'的意思是:当.py文件被直接运行时,if __name__ == '__main__'之下的代码块将被运行;当.py文件以模块形式被导入时,if __name__ == '__main__'之下的代码块不被运行。

假设我们有一个const.py文件,内容如下:

PI = 3.14

def main():
    print("PI:", PI)

main()

# 运行结果:PI: 3.14

现在,我们写一个用于计算圆面积的area.py文件,area.py文件需要用到const.py文件中的PI变量。从const.py中,我们把PI变量导入area.py:

from const import PI

def calc_round_area(radius):
    return PI * (radius ** 2)

def main():
    print("round area: ", calc_round_area(2))

main()

'''
运行结果:
PI: 3.14
round area:  12.56
'''

我们看到const.py中的main函数也被运行了,实际上我们不希望它被运行,因为const.py提供的main函数只是为了测试常量定义。这时if __name__ == '__main__'派上了用场,我们把const.py改一下,添加if __name__ == "__main__"

PI = 3.14

def main():
    print("PI:", PI)

if __name__ == "__main__":
    main()

运行const.py,输出如下:

PI: 3.14

运行area.py,输出如下:

round area:  12.56

3、chardet.detect()函数

首先,介绍一下chardet.detect()函数

detect()函数接受一个参数,一个非unicode字符串。它返回一个字典,其中包含自动检测到的字符编码和从0到1的可信度级别。

返回的内容有三个:
encoding:表示字符编码方式。
confidence:表示可信度,也可以理解为检测的概率。
language:语言。

我们用这个函数来分别检测gbk,utf-8,日文

import chardet

str1 = "离离原上草,一岁一枯荣".encode('gbk')
str2 = "野火烧不尽,春风吹又生".encode('utf-8')
str3 = "こんにちは".encode('euc-jp')

print(chardet.detect(str1))
print(chardet.detect(str2))
print(chardet.detect(str3))

检测结果如下:

{'encoding': 'GB2312', 'confidence': 0.7407407407407407, 'language': 'Chinese'}
{'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
{'encoding': 'EUC-JP', 'confidence': 0.99, 'language': 'Japanese'}
#  其中GBK是GB2312的子集,所以说检测结果是正确的

大概率其实都是正确的。

这里检测的结果返回的是字典,而我们需要的是encoding的内容,即

chardet.detect()['encoding']

4、作业:

import argparse
from pip._vendor import chardet

if __name__ == '__main__':
    
    # 构建命令行参数的参数
    parser = argparse.ArgumentParser(description='change into the type of UTF-8')
    parser.add_argument('-fl', '--filename', type=str, help='the name of file.')
    parser.add_argument('-ty', '--type', type=str, help='the type of encoding.')
    args = parser.parse_args()
    etype = args.type

    print(args.filename)
    # 检测文件的编码格式
    with open(args.filename, 'rb') as f:
        fileData = f.read()
        if not etype:
            # 假使未输入编码格式
            etype = chardet.detect(fileData)['encoding']
            print("您未输入编码格式,通过检测,编码格式为:", etype)

    # 编码转换成UTF-8,转存
    f = open(args.filename, 'r', encoding=etype)
    content = f.read()
    print(content)
    f.close()

    f = open(args.filename, 'w', encoding='utf-8')
    f.write(content)
    f.close()
    print("转存成功!")
  1. chardet模块(一个方法)
  2. argparse模块(三个方法)
  3. 命令行参数要输入绝对路径

5.map()

map()函数是Python中的一个内置函数,它的功能是:将指定的函数,依次作用于可迭代对象的每个元素,并返回一个迭代器对象。这个可迭代对象,可以是一个也可以是多个。

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
西电数值分析大作业是指西安电子科技大学数值分析课程的期末大作业。通常,学生将选择一个数学问题,并使用数值方法来解决该问题。 其中,CSDN 是一家专注于开发者社区的网站,它提供了丰富的技术文章、博客和教程,对于学生来说,CSDN可以为他们学习、交流和查找相关资料的重要平台。 在西电数值分析大作业中,学生可以利用CSDN这个平台进行相关研究和学习。首先,他们可以通过搜索CSDN上的数值分析相关文章和教程,了解和学习数值方法的基本原理和应用。其次,他们可以阅读其他人尝试解决类似问题的博客和文章,从中获取灵感和启发。此外,学生还可以通过CSDN提供的讨论区与其他学习者交流,并向他们请教问题,共同探讨解决方案。 对于学生而言,利用CSDN这个平台有以下几个优点:首先,可以帮助学生更好地理解和掌握数值分析的相关知识和技能。其次,可以借鉴他人的经验和做法,提高自己的解决问题的能力。最后,通过与其他学习者的交流,可以扩大自己的视野,获得更多的学习资源和思路。 总结而言,利用CSDN这个平台对于西电数值分析大作业来说是非常有益的。学生们可以通过CSDN获取相关资料和经验,提高自己的解决问题的能力,为完大作业做准备。同时,也可以通过交流与他人学习和分享,促进学习效果的提高。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值