无效书评规则:如果书评中出现一半以上的重复字符,就认为该书评无效。
comments = ['这是一本非常好的书,作者用心了',
'作者大大辛苦了',
'好书,感谢作者提供了这么多的好案例',
'书在运输的路上破损了,我好悲伤。。。',
'为啥我买的书上有菜汤。。。。',
'啊啊啊啊啊啊,我怎么才发现这么好的书啊,相见恨晚',
'书的质量有问题啊,怎么会开胶呢??????',
'好好好好好好好好好好好',
'好难啊看不懂好难啊看不懂好难啊看不懂',
'书的内容很充实',
'你的书上好多代码啊,不过想想也是,编程的书嘛,肯定代码多一些',
'书很不错!!一级棒!!买书就上当当,正版,价格又实惠,让人放心!!! ',
'无意中来到你小铺就淘到心意的宝贝,心情不错! ',
'送给朋友的、很不错',
'讲解内容深入浅出又清晰明了,推荐给喜欢Python的朋友们。']
rule = lambda s: len(set(s))/len(s) >= 0.5 #lambda相当于一个未命名函数,接收参数s,返回:后面表达式的值
#用set(s)把字符串s转换为集合,转为集合就会去除其中的重复值
#去除重复值以后的长度除以原字符串长度,结果大于等于0.5则不用过滤
print(rule)
result = filter(rule, comments) #filter() 函数用于过滤序列,根据rule函数的规则,对可迭代器对象comments进行过滤,返回一个可迭代对象,如果要转换为列表,可以使用 list() 来转换。
#该接收两个参数,第一个为函数,第二个为序列,序列的每个元素作为参数传递给函数进行判断,然后返回 True 或 False,最后将返回 True 的元素放到新列表中。
for comment in result:
print(comment)
#也可以用print(*result ,sep='\n')进行输出