华科图书馆项目总结

仔细想想,华科图书馆的这次项目,还是职业生涯的处女秀。然而这次项目,却不是那么顺利,经历了很多不快。

首先,可以发现给学校做项目是多么的麻烦,钱不多事还不少。

其次,这次着实被需求坑了一把。以前只是在课堂上了解了一下,这次亲身体会了。甲方动不动就改需求,是多么蛋疼的一件事。而且每次只提一点需求,所以昨天做好的东西,今天要改;明天又说今天哪里做的不好,又得继续改。如此反复,搞得人累不说,也很降低工作效率。

最后,每天从早上九点做到晚上十点左右,做的很累。而且,经常没有双休,真的很郁闷。


不管怎么样,还是在这个项目上花了两个多月的时间,虽然做的东西不够深入,但还是把做过的东西暂且记下来再说。

1.前端

前端这块,因为要做大量报表,本来准备自己做页面,后来使用报表软件FineReport时发现它自带了一个大数据决策系统。不过这个东西也很坑就是了,还得花钱。所以最后,前端这块主要就是用那个软件做报表。主要分为三步,使用sql语句查询数据库得到数据集,设置参数面板,制作报表。这里稍微熟悉了sql语句的使用,包括group by,in,substring和impala自带的一些函数等。


2.后端

后端这块,主要是做算法。这里我只负责了一个算法,决策树分类算法ID3。先从网上下的代码,使用之后发现这个算法只适合枚举类型,如果属性有数值型的并不合适。后来病急乱投医,从网上下了一个weka软件,导入输入数据,就可以得到决策树,然后写出分类规则。根据决策树写分类规则的代码在另一篇博文中有写,并没有技术含量,这里就不赘述了。然后,为了写毕业论文,我又自己装linux,搭hadoop,运行mahout单机版和分布式版,玩的也是不亦乐乎。最后说说我毕业论文中用到的算法,主要是基于用户的协同过滤算法和基于物品的协同过滤算法,以后有机会再贴上来。这也是在实际项目中第一次与算法打交道。通过这次学习,我深刻地认识到,算法的本质就是数学啊。所以,学好数学还是很重要滴。


3.其它

本人新手,不喜勿喷。通过这次项目,还零零总总地学习了一些其它的东西。比如,第一次装linux,linux命令的熟悉,第一次搭伪分布式hadoop平台,mapreduce的入门与熟悉,还有java的熟悉,eclipse的熟悉,等等。


总之,这次项目也学到了一点点东西。虽然不够深入,但也值得在此做个总结,以备后面继续学习,在大数据和机器学习方面继续深造。另外,项目中有些代码上传到github主页上去了。以后有机会,再把我的github主页贴上来。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值