python 文章分行 去掉看不见的换行

def extr():
    b=f.splitlines()
    list=[]
    x=1
    for line in b:
        if line.split():
            list.append(line)
    res='\n'.join(list)
    return res

发现个问题,有的网页换行但是去不掉。用去掉'/n'的方法根本不行。例如

f='''        <li><a href="#">首页</a></li>

        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">财务管理</a></li>

        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">经济法</a></li>

        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">中级会计实务</a></li>

        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">工作年限</a></li>

        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">划分标注</a></li>

        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">考点汇总</a></li>

        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">历年真题</a></li>

        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">重点题库</a></li>

        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">考点变化</a></li>'''
lines=f.split('/n')
print(lines)
list_e=[]
for line in lines:
    line = line.strip()
    list_e=list_e.append(line)

得到一个结果

['        <li><a href="#">首页</a></li>\n\n        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">财务管理</a></li>\n\n        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">经济法</a></li>\n\n        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">中级会计实务</a></li>\n\n        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">工作年限</a></li>\n\n        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">划分标注</a></li>\n\n        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">考点汇总</a></li>\n\n        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">历年真题</a></li>\n\n        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">重点题库</a></li>\n\n        <li><a href="//www.skwjg.com/zhongjikuaijishi.html#bdpc3" target="_blank">考点变化</a></li>']

最终代码

def extr(f):

    b=f.splitlines()

    list=[]

    for line in b:

        if line.split():

            list.append(line)

    res='\n'.join(list)

    return res

用splitlines() 分开行,然后用split() 检测空行,空行跳过,最后用'/n'.join() 形成文章

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lisheng386

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值