一、前言
在抓取一个网站时需要获取一下具体发表时间,可是通过分析整个接口,又分析了一批数据之后发现:返回的数据也不一定是准确的,还是网站上自己解析页面再入库最为靠谱。
直接返回的是标准日期时间,非常好处理,可是如果解析页面获取到的时间有点不好处理
如图所示,这种日期的话我也是第一次处理
在某度上搜了搜,都是阿拉伯转汉字,这就难受了,自己花点时间写个吧
二、正文
思路:需要考虑的是各种各样的日期简单举几个例子
二〇二〇年四月八日
二〇二〇年四月十二日
二〇二〇年四月二十日
二〇二〇年四月三十一日
二〇二〇年十一月二十一日
其实需要麻烦点处理的是这个“十”
还有二十三十日等,月份最多也就是十二
遇到年月日直接往后接着拼就可以了
在网上找了个哥们的代码,至少有一小部分不用写了
他这个是中文数字转阿拉伯数组
/**
* 中文數字转阿拉伯数组【十万九千零