将网站上的信托计划净值数据写入excel,涉及dataframe排序,转换数据类型,列表填入dataframe,取小数点后四位的正则,dataframe生成excel

本文介绍了如何使用Python和正则表达式从网站上抓取信托计划的净值数据,并将其整理成Excel表格。首先,通过正则表达式匹配所需的数据,然后对提取的列表进行处理,分割日期和年化收益率。接着,将数据填充到DataFrame中,进行数据类型的转换和排序,最终生成Excel文件。
摘要由CSDN通过智能技术生成

信托计划净值数据写入excel

取需要的数据

现有一大堆文字现需把基净值取出来

正则表达式

推荐一个网址,用来测试正则表达式可视化特别直观
https://regex101.com/
如图:官网的净值
官网净值表
原始内容:
在这里插入图片描述
实际上我只想要2022-10-26 0.6711 2.8648 2.XXXX这种规律的数据,但是经过多次搜索(原谅我是小白),发现正则表达式只能提取连续的数据
由于原始内容里面还有很多单独的日期,所以我如果利用正则|,来提取,就会多出来几个光秃秃的日期,不利于数据的一一匹配
所以我经过观察数据,选择提取一大段,如图彩色部分
正则表达式如下:

"\d{4}-\d{2}-\d{2}([\s\S]*?[0-9]{1,}[.][0-9]{4}){3}"

结果发现,正则以后,得到的结果并不对,原因就是,网站上的净值是补零了,实际上的数据没有补零
重新编写了正则表达式

20\d{
   2}-\d{
   2}-\d{
   2}([\s\S]*?[0
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值