取需要的数据
现有一大堆文字现需把基净值取出来
正则表达式
推荐一个网址,用来测试正则表达式可视化特别直观
https://regex101.com/
如图:官网的净值
原始内容:
实际上我只想要2022-10-26 0.6711 2.8648 2.XXXX这种规律的数据,但是经过多次搜索(原谅我是小白),发现正则表达式只能提取连续的数据
由于原始内容里面还有很多单独的日期,所以我如果利用正则|,来提取,就会多出来几个光秃秃的日期,不利于数据的一一匹配
所以我经过观察数据,选择提取一大段,如图彩色部分
正则表达式如下:
"\d{4}-\d{2}-\d{2}([\s\S]*?[0-9]{1,}[.][0-9]{4}){3}"
结果发现,正则以后,得到的结果并不对,原因就是,网站上的净值是补零了,实际上的数据没有补零
重新编写了正则表达式
20\d{
2}-\d{
2}-\d{
2}([\s\S]*?[0