- 博客(1)
- 资源 (2)
- 收藏
- 关注
原创 python codecs.open视\u2028字符为换行符
使用codecs.open逐行读取文件时,发现有一行数据被分成了两行,原因是使用codecs.open打开后再逐行读取时会将字符\u2028视为换行,经搜索发现该字符是javascript中的转义字符,在一些从网页上抓取的文本中常见,同理还有\u2029,示意代码如下:import codecstxt = u'aa\nbb\u2028cc'fd = open('a.txt', 'wb')
2017-09-11 15:08:39 1997 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人