字符串、文件操作,英文词频统计预处理

 

1.字符串操作:

  • 解析身份证号:生日、性别、出生地等。
ID = input('请输入身份证号码(18位): ')
if len(ID) == 18:
    print("你的身份证号码是 " + ID)
else:
    print("输入错误")
 
ID_address=ID[0:6]
ID_birth = ID[6:14]
ID_sex = ID[14:17]
year = ID_birth[0:4]
moon = ID_birth[4:6]
day = ID_birth[6:8]

if int(ID_sex) % 2 == 0:
    ID_sex=''
else:
   ID_sex = ''
print('出生地编号:{}  \n出生日期:{}年{}月{}日   \n性别:{}'.format(ID_address,year,moon,day,ID_sex))

 

  • 凯撒密码编码与解码
a =input('请输入字母:')
str=''
zimu = ['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z']
a = a.lower()
for i in range(len(a)):
    if a[i] in zimu:
        a.split()
        temp = ord(a[i])
        num = (temp - 97 + 3) % 26
        str = chr(num + 97)
        print(str,end="")
    else:
        print(" ",end="")

 

 

  • 网址观察与批量生成
for i in range(19,23):
    url = 'http://news.gzcc.cn/html/2019/xibusudi_0304/109{}.html'.format(i)
    print(url)

 

2.英文词频统计预处理

  • 下载一首英文的歌词或文章或小说,保存为utf8文件。
  • 从文件读出字符串。
  • 将所有大写转换为小写
  • 将所有其他做分隔符(,.?!)替换为空格
  • 分隔出一个一个的单词
  • 并统计单词出现的次数。
f = open('text1.txt','r+')
text = f.read()
f.close()
text=text.lower()
sep=",.'?!"
for s in sep:
    text=text.replace(s,' ')
print(text.split())
print(text.count('baby'),text.count('she'))

 

转载于:https://www.cnblogs.com/hjyjy/p/10469824.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值