既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
《长恨歌》文本
整理网站页面CV的字符串
(python字符串基础知识实战)
目 录
这是一段由聊天引出的代码应用——
由聊天中齐老师的一段引文,让我搜索学习了缠绵凄美的《长恨歌》,动了CV其文本的心思。
可从页面CV到文本,却成了下面截图的样子😭😭
一字一行,期间还间杂一些注释索引的数字。手动整理?这文本可不短!还是让让代码出手吧——
不就是一个字符串基础的应用嘛。“数据特征分析,利用特征选用适宜方法代码,整理数据,得想要的结果。”去除回车符和数字字符,按每句诗一行打印就好。
上码——
代码
title = '长恨歌\_网cv'
filename = f'/sdcard/Documents/{title}.txt'
with open(filename) as f:
s = f.read().split('。') # 用“。”分割长恨歌文本。
s = map(lambda x: x.replace('\n', ''), s) # 去除回车符。
print(\*s)
input()
诗句注释的索引数字还没去除哩!加代码——用个函数循环,遍历去除数字和回车符。
代码
def mydel(s):
''' 去除回车符和数字 '''
temp = []
for i in s:
if i not in '01234567890\n':
temp.append(i) # 收集非数字和回车符的字符。
return ''.join(temp)
with open(filename) as f:
s = f.read().split('。') # 用“。”分割长恨歌文本。
s = map(mydel, s) # 去除回车符。
print(\*s)
成功得到了想要的诗文字符串列表,只要写入文本文件,就“大功告成”。
代码
# 写入文本
title = '《长恨歌》'
filename = f'/sdcard/Documents/{title}.txt'
with open(filename, 'w') as f:
f.write('。\n'.join(map(mydel, s))) # 将用。和换行符拼接的文本写入文本文件。
成了!只需在文本首行敲几个回车就好😄。
到此,问题解决,看似完结。其实,前面的代码只是“信手拈来”不够严谨,更可以优化改写。遍历每句诗去除回车和数字,是不是太复杂?
把整个文件读取的字符串中,要去除的仅是数字和回车符。数字仅是0~9的字符组成,所以仅需遍历10个数字,分别替换成’'空字符就好。
优化改写后的代码
#!/sur/bin/nve python
# coding: utf-8
title = '长恨歌\_网cv'
filename = f'/sdcard/Documents/{title}.txt'
with open(filename) as f:
s = f.read() # 读取CV诗文文本。
for i in '0123456789': # 遍历去除数字。
s = s.replace(i, '')
# 写入文本
title = '《长恨歌》'
filename = f'/sdcard/Documents/{title}.txt'
with open(filename, 'w') as f:
poems = s.replace('\n', '').split("。") # 去除回车符并分割诗句。
f.write('。\n'.join(poems)) # 用。和回车符拼接诗句列表并写入文件。
__上一篇:__ 反斜杠让您的csv文档字符不撞车,让“借”(白嫖)您csv数据的人叫苦不迭
__下一篇:__
我的HOT博:
- 给定字符串提取姓名(字符串、list、re“零宽断言”)(1051阅读)
- 我的 Python.color() (Python 色彩打印控制)(1125阅读)
- python清屏(1290阅读)
- 回车符、换行符和回车换行符(1322阅读)
- Linux 脚本文件第一行的特殊注释符(井号和感叹号组合)的含义(1171阅读)
- pandas 数据类型之 Series(1224阅读)
- 聊天消息敏感词屏蔽系统(字符串替换 str.replace(str1, *) )(1270阅读)
- 练习:银行复利计算(用 for 循环解一道初中小题)(1188阅读)
- pandas 数据类型之 DataFrame(2136阅读)
- :班里有人和我同生日难吗?(蒙特卡洛随机模拟法)(2180阅读)
- Python字符串居中显示(2359阅读)
- 练习:求偶数和、阈值分割和求差( list 对象的两个基础小题)(1665阅读)
- 用 pandas 解一道小题(2007阅读)
- 可迭代对象和四个函数(1083阅读)
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
mg-ipH5KJek-1715791996865)]
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!