字符串操作、文件操作,英文词频统计预处理

本作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2684

一、字符串操作

(一)基本要求

  • 解析身份证号:生日、性别、出生地等。
  • 凯撒密码编码与解码
  • 网址观察与批量生成

(二)编码实现

1、解析身份证

sfz=[]
'''存放身份证前两位对应的省名'''
placeNum={'11':'北京市','12':'天津市','13':'河北省','14':'山西省','15':'内蒙古自治区','21':'辽宁省','22':'吉林省','23':'黑龙江省','31':'上海市','32':'江苏省','33':'浙江省','34':'安徽省','35':'福建省','36':'江西省','37':'山东省',
          '41':'河南省','42':'湖北省','43':'湖南省','44':'广东省','45':'广西壮族自治区','46':'海南省','50':'重庆市','51':'四川省','52':'贵州省','53':'云南省','54':'西藏自治区','61':'陕西省','62':'甘肃省','63':'青海省','64':'宁夏回族自治区',
          '65':'新疆维吾尔自治区','71':'台湾省','81':'香港特别行政区','91':'澳门特别行政区',}

print('身份证解析小程序~')
sfz=input('请输入您的身份证号码:')
print('您的身份证号码为:'+sfz)
print('解析开始......')

'''出生年月日'''
bir=[]
for i in sfz[6:14]:
    bir.append(i)
birY=''.join(bir[0:4])
birM=''.join(bir[4:6])
birD=''.join(bir[6:8])

'''出生地'''
place=placeNum[''.join(sfz[0:2])]

'''判断性别'''
sexNum=int(sfz[16])
if sexNum%2 == 0:
    sex='girl'
else:
    sex='boy'

'''输出信息'''
print('Hi,'+sex+',我知道你是'+birY+''+birM+''+birD+'日出生的'+place+'人哦!')

 

2、凯撒密码

print('下面是凯撒加密')
mw=input('请输入您需要加密的明文:')
MiMa=''
jiemi=''for i in mw:
    MiMa=MiMa+chr(ord(i)+3)
print('加密后的密码为:',MiMa)

 

3、网址观察与生成

print('下面是校园新闻~')
for i in range(2,15):
    print('http://news.gzcc.cn/html/xiaoyuanxinwen/{}.html'.format(i))

 

(三)截图展示

1、解析身份证

2、凯撒密码

 

3、网址观察与生成

 

二、英文词频统计预处理

(一)基本要求

  • 下载一首英文的歌词或文章或小说。
  • 将所有大写转换为小写
  • 将所有其他做分隔符(,.?!)替换为空格
  • 分隔出一个一个的单词
  • 并统计单词出现的次数。

(二)编码实现

import string
song='''
Every night in my dreams
I see you,I feel you
That is how I know you go on
Far across the distance
And spaces between us
You have come to show you go on
Near far
Wherever you are
I believe
That the heart does go on
Once more you open the door
And you're here in my heart
And my heart will go on and on
Love can touch us one time
And last for a lifetime
And never let go till we're gone
Love was when I loved you
One true time I hold to
In my life well always go on
Near far
Wherever you are
I believe
That the heart does go on
Once more you open the door
And you're here in my heart
And my heart will go on and on
you're here
There's nothing I fear
And I know
That my heart will go on
We'll stay forever this way
You are safe in my heart
And my heart will go on and on
'''

for c in string.punctuation:
    song = song.replace(c," ")

'''歌词转为小写并分成单词'''
songDC=song.lower().split( )

'''字典'''
count={}
for i in songDC:
    if i in songDC:
        count.setdefault(i,0)
        count[i]+=1
print(count)

 

(三)截图展示

三、文件操作

(一)基本要求

1、凯撒密码:从文件读入密函,进行加密或解密,保存到文件。

2、词频统计:

    • 下载一首英文的歌词或文章或小说,保存为utf8文件。
    • 从文件读入文本。

(二)编码实现

1、凯撒密码

print('下面是凯撒加密')
file=open("mw.txt")
mw=file.read()
MiMa=''
jiemi=''
for i in mw:
    MiMa=MiMa+chr(ord(i)+3)
file = open("MiMa.txt", 'w')
file.write(MiMa)
file.close()
print('成功保存凯撒密码!')

 

2、词频统计

import string
file=open("song.txt")
song=file.read()

for c in string.punctuation:
    song = song.replace(c," ")

'''歌词转为小写并分成单词'''
songDC=song.lower().split( )

'''列表转集合去重'''
count={}
for i in songDC:
    if i in songDC:
        count.setdefault(i,0)
        count[i]+=1
print(count)

 

(三)截图展示

1、凯撒密码

 

2、词频统计

转载于:https://www.cnblogs.com/sanshuishu/p/10497222.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
在Python中,可以使用以下步骤来进行英文词频统计: 1. 准备文本数据:首先,你需要有一个包含英文文本的文件字符串。你可以从文件中读取文本或直接使用字符串。 2. 文本预处理:对文本进行预处理是一个重要的步骤。你可以使用正则表达式或其他方法去除标点符号、数字和特殊字符,将所有字母转换为小写等。 3. 分词:将文本分割成单词。可以使用空格、标点符号或其他自定义分隔符来拆分文本。 4. 统计词频:使用Python的字典数据结构来统计每个单词的出现次数。遍历分词后的列表,对每个单词进行计数。 5. 排序:根据词频进行排序,可以按照出现次数从高到低或从低到高排序。 下面是一个示例代码,用于展示如何实现英文词频统计: ```python import re from collections import Counter def word_frequency(text): # 文本预处理 text = text.lower() # 转换为小写 text = re.sub(r'[^a-zA-Z\s]', '', text) # 去除标点符号和特殊字符 # 分词 words = text.split() # 统计词频 word_count = Counter(words) return word_count # 示例文本 text = "This is a sample text. It contains some sample words." # 统计词频 frequency = word_frequency(text) # 打印词频结果 for word, count in frequency.most_common(): print(f'{word}: {count}') ``` 上述代码将输出: ``` sample: 2 this: 1 is: 1 a: 1 text: 1 it: 1 contains: 1 some: 1 words: 1 ``` 这是每个单词及其出现次数的词频统计结果。你可以根据实际需求进行进一步的处理和分析。希望对你有帮助!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值