python基金比较上机题_用Python找到最赚钱的基金|不看这篇你会后悔

上一篇我们已经把6500多只基金存入了CSV文件,这是一个大的表格数据,我们先读取数据并初步了解一下吧

a).读入CSV文件

df=pd.read_csv(file)

b).看看有多少只基金

c).熟悉数据格式,看看行列的信息

d).看看表格中的前5只基金

经过上面3步,我们已经知道了这个大表格数据是6549行*8列,其中:

index是从0开始到6548的int

fund_id是基金的id

fund_name这一列都是中文字符

其他的列都是带百分号的数字字符串

index是从0开始到6548的int

fund_id是基金的id

fund_name这一列都是中文字符

其他的列都是带百分号的数字字符串

这样的序列数据,我们要处理会有一些麻烦,比如:

index不是基金id,不好统计

涨幅都是带百分号的字符串,如何排序和统计

如何要横向统计,每一个行中有既有fund_name中文字符,又有百分百的数字,如何求和

index不是基金id,不好统计

涨幅都是带百分号的字符串,如何排序和统计

如何要横向统计,每一个行中有既有fund_name中文字符,又有百分百的数字,如何求和

如何解决这3个问题呢,我们接着往下看

1).先把index换成基金的id

把fund_id作为index,便于后面的处理,会方便很多,用DataFrame里面的set_index函数

2).看看index是不是已经换了

3).去掉NA行

表格里面有很多空的数据,这样的数据会影响我们的分析,我们必须要去掉

#去掉NA的行

4).去掉fund_name

为啥要去掉fund_name,比如我们想统计一个基金的1个月,3个月,6个月,1年,3年和成立以来的和,看看它的总成绩如何

直接sum的会有一个问题,就是fund_name是字符串,所以我们先把fund_name去掉吧,然后把fund_id那一列也去掉,因为index已经是fund_index我们就不要重复啦

这样的数据是不是干净了很多,清爽了很多啊

5).然后去掉%,我们就可以愉快的排序了

如何取消%,这个时候我们需要用到pandas里面的一个大名鼎鼎的apply函数

1).经过前面2步,已经万事俱备

也就是说我们可以随心所欲的分析,先来看看头牌的情况,获得每一列的最大值,看看整个基金里面的头牌的情况,我们取前100名

#获得"from_start"(按照基金成立)以来涨幅大小排序

2).找出全能王中王

我们想知道所以的组合里面有没有最强的,就是从成立以来都是涨的,而且3年,1年,半年,3个月,1个月一直都在涨的,这样的基金简直就是王中王啊,到底有没有呢,怎么找呢

#取上面所有的index并转化成集合

#取成立以来都是涨的,而且3年,1年,半年,3个月,1个月一直都在涨的

#看来没有东方不败,一直都是在涨基金,那有没有3年,1年,6个月,3个月,1个月都在涨的基金呢

哇真的有啊,发现这4个基金才是真正的黄金,激动的老泪纵横~~稳健的投资者可以考虑这4个基金

3).1年以内的最佳基金

积近的投资者,肯定还想看看最近1年的所以数据

#把上面的最佳基金横向求和,看到底那个最好

发现最好的1只基金150270一年涨了1.7倍多,太爽了,看看名字叫啥

原来最好的基金就是南方消费进取

结论:

好了,今天6500多只基金数据分析篇就先讲到这里,其实数据分析是非常有趣的,这个小项目算是完成了,上面的对基金数据分析只是冰山一角,还有很多地方可以挖掘和分析,而基金投资,特别是量化基金投资涉及很多方面和模型,最主要的就是选基金只是第一步,还有如何买,投资多少,如何建模减少风险,如何卖,等等都有很讲究,今天的内容希望能给初学者一些启发,若有什么不懂的,也可以留言跟我探讨交流

天善学院svip包含Excel BI、Python爬虫案例、Python机器学习、Python数据科学家、大数据、数据分析报告、数据分析师体系、深度学习、R语言案例10套课程火爆报名中,欢迎大家关注 www.hellobi.com/svip

转载请保留以下内容:

本文来源自天善社区菜鸟学Python老师的博客(公众号)。

原文链接:https://ask.hellobi.com/blog/caoniao_xueyuan/8590

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值