读取txt文件出现出现多余空行问题

本文介绍了在Python中读取txt文件时遇到的多余空行问题及其解决方法。通过分析原理,作者发现文件每行末尾的换行符在读取时会导致空行。通过实验验证,使用.strip()和.rstrip()方法可以有效消除空行,其中.strip()去除整体的空格和换行符,.rstrip()去除末尾的空格和换行符。
摘要由CSDN通过智能技术生成

0 前言

昨天写一个简单的爬虫,批量读取txt文本的每行url,然后传到requests.get去解析,可是一个神奇的bug出现了,不管我怎么修改总是出现bug,原理上,应该没什么问题,所以一步步的查错,最终终于发现读取txt时出现错误,哎,学艺不精,花了不少时间。因此要纪念下这个小知识点。

1 正文

1.1 原理

文件中每行末尾会有一个隐藏的换行符“\n”,读取的时候“\n” 就会被解析出来换成行,然而我们并没有发现。一个很好的验证方法时用print(),可以直观的发现有空行产生。

1.2 小实验验证一波

txt文本内容

111.txt
111111122222
333333444444
555555666666

直接打印 

for line in open("111.txt", encoding='utf-8').readlines():
    url = line
    #url = line.rstrip()  # 去掉末尾隐藏的\n,避免出现空行。
    print(url)

结果,会发现有空行,让人头疼。

111111122222

333333444444

555555666666

1.3 解决方法

python自带.strip()和.rstrip()

  • .strip()的意思是消除字符串整体的指定字符
  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值