提出问题
本文拟分析可以在场内进行交易的基金(LOF、ETF),既可以满足短线套利,又可以做长期投资。提出以下问题:上市三年以上总收益前三高的场内交易基金有哪些?
今年新上市的场内交易基金哪些较值得关注?
(详情见EXCEL篇。)
数据导入
将采集加工保存后的EXCEL文件导入MYSQL:首先需将xlsx文件另存为xls文件,再按如下步骤操作:
根据导入向导选择目标文件后,文件中存在多个工作表的选择对应的工作表,然后根据向导点击‘next’,最终成功导入数据,如下表:
整理数据缺失值处理。通过数据浏览,可看出‘单位净值|日期’这一列为‘---’时,后面的数据均为‘---’,无意义,可做删除处理。
可看出原数据有606项,删除无效数据后还剩589项。需要注意的是,对表做增删等更新处理后,需关闭表格再重新打开,才能看出改动已生效。
2. 一致化处理。基金代码名称为6位数,单位净值与日期需拆分为两列。
由于单位净值与日期不作分析处理,故不在原表上做修改。
3. 筛选LOF、ETF基金。共24条记录。(EXCEL中算上字段名那一行共计25)
探索数据成立三年以上,排除近三年数据为无效数据的基金后,创建视图oldfunds,按字段“成立来”数据降序。
可知:老基金中,自成立以来总收益排前三的基金分别为: