(1)题目一:
编写程序,把一个英文句子中的单词倒置,标点符号不倒置(例如:I like beijing. 经过函数后变为:beijing. like I)
源码:
sentence = input("请出入一句英文:")
lst = sentence.split(' ')
lst.reverse()
ans = ' '.join(lst)
print(ans)
运行结果截图:
输入:I like beijing.
返回:beijing. like I
实验过程分析:对split()、reverse()、join()函数有了更深刻了解
- 题目二:
编写程序,查找一个字符串中最长的数字子串。
源码:
def find(s):
max_len = 0
count = 0
end = 0
for i in range(len(s)):
if '0 N' <= s[i] <= '9':
count += 1
if max_len < count:
max_len = count
end = i
else:
count = 0
return s[end - max_len + 1:end + 1]
st = input("请输入一个字符串:")
print(find(st))
运行结果截图:
实验过程分析: 对字符串应用更加灵活
- 题目三:
判断待测单词与候选单词列表中的哪一个单词最接近:判断标准为26个字母在单词中的出现频次最接近。
源码:
from collections import Counter
def checkAndModify(word):
# 待检测单词的字母频次
fre = dict(Counter(word))
# 待测单词中各字母频次与所有候选单词的距离,即字母频次之差
similars = {w:[fre[ch]-words[w].get(ch,0) for ch in word]+[words[w][ch]-fre.get(ch,0) for ch in w] for w in words}
# 返回最接近的单词,即字母频次之差的平方和最小的单词
return min(similars.items(), key=lambda item:sum(map(lambda i:i**2, item[1])))[0]
# 候选单词
words = {'good', 'hello', 'world', 'python', 'fuguo', 'yantai', 'shandong', 'great'}
# 每个单词中字母频次
words = {word:dict(Counter(word)) for word in words}
# 测试
for word in ['god', 'hood', 'wello', 'helo', 'pychon', 'guguo', 'shangdong']:
print(word, ':', checkAndModify(word))
运行结果:
实验过程分析:对字典以及for循环应用更加深入,利用键来索引值的应用更加灵活,同时也了解到自动计数函数counter()函数的用法, 字典中get(ch, 0)方法可以用来统计ch在字符串中出现次数
- 题目四:
给定任意字符串,查找其中每个字符的最后一次出现,并按每个字符最后一次出现的先后顺序依次存入列表。例如对于字符串'abcda'的处理结果为['b', 'c', 'd', 'a'],而字符串'abcbda'的处理结果为['c', 'b', 'd', 'a']。
源码:
s = input('输入字符串:')
r = []
i = 1
for j in range(len(s)+1):
if i < len(s):
if s.count(s[i]) == 1:
r.append(s[i])
s = s[1::]
print(r)
运行结果截图:
实验过程分析:rfind()函数可以自动返回某个元素最后一次出现位置,对元组b整体排序时,会根据其第一项值来整体带动整体参与排序。
实验4:
(1)题目一:
假设有一段英文,其中有单独的字母I误写为i,请编写程序进行纠正。
源码:
import re
text = "i am i like,i I am a tiff"
text = re.sub(r'(\bi\b)', "I", text)
print(text)
运行结果截图:
实验过程分析:对re包理解更加深刻,正则表达式中需要用 ‘\b’来控制匹配到的是完整的单词。对re包中sub函数理解更加深刻
(2)题目二:
假设有一段英文,其中有单词中间的字母i误写为I,请编写程序进行纠正。
源码:
import re
text = "I am i lIke,I I am a tIff"
text = re.sub("I", "i", text)
text = re.sub(r'(\bi\b)', "I", text)
print(text)
运行结果截图:
实验过程分析:先利用sub()函数,将所有的I 都替换成i ,再利用题目一中的思路,对那些单独的 I ,再替换回i
(3)题目三:
有一段英文文本,其中有单词连续重复了2次,编写程序检查重复的单词并只保留一个。
源码:
import re
text = "This is is a a very very good boy boy"
text = re.sub(r'(\b\w+) \1', r'\1', text)
print(text)
运行结果截图:
实验过程分析:
利用模式匹配,“(\b\w+)\1”会匹配到连续两次出现的单词(中间以空格隔开),,而\1,则指(\b\w+)即,重复出现的单词本身,用“\1”来替换“(\b\w+)\1”,则可以达到目标效果。
(4)题目四:
编写程序,用户输入一段英文,然后输出这段英文中所有长度为3个字母的单词。
源码:
import re
sr = input('请输入一段英文:')
print(re.findall(r'\b[a-zA-Z]{3}\b', sr))
运行结果截图:
当输入内容为:“I am a boy, not a man! Thanks!”时,程序会输出长度为三的单词,boy not man
实验过程分析:
利用\b来确定是单词,[a-zA-Z]{3}来指定 单词长度为3。最后用findall()函数去寻找字符串中满足条件的单词