以前老用(.*?)提取数字,今天发现不对了,比如一行数字为:
0 0.248438 0.255556 0.128125 0.194444
用:
re.findall('(.*?) (.*?) (.*?) (.*?) (.*?)', line)
去提取,就会漏掉最后一个数字,变成:
[('0', '0.248438', '0.255556', '0.128125', '')]
也不知是为啥
后来参考了:python从字符串中提取数字
知道提取数字也有其特定的方式
后来使用了语法:
re.findall('(\d+.?\d*) (\d+.?\d*) (\d+.?\d*) (\d+.?\d*) (\d+.?\d*)', content_)
就能成功提取了
不过使用过程中,pycharm报了这个问题:
20200226
用np.fromstring()函数也能提取?貌似还挺好用?