华科图书馆项目总结

最新推荐文章于 2023-10-11 13:37:34 发布

sunwhut333

最新推荐文章于 2023-10-11 13:37:34 发布

阅读量1.5k

点赞数

分类专栏： hadoop 文章标签： linux Hadoop mahout

本文链接：https://blog.csdn.net/sunwhut333/article/details/46271477

版权

hadoop 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

仔细想想，华科图书馆的这次项目，还是职业生涯的处女秀。然而这次项目，却不是那么顺利，经历了很多不快。

首先，可以发现给学校做项目是多么的麻烦，钱不多事还不少。

其次，这次着实被需求坑了一把。以前只是在课堂上了解了一下，这次亲身体会了。甲方动不动就改需求，是多么蛋疼的一件事。而且每次只提一点需求，所以昨天做好的东西，今天要改；明天又说今天哪里做的不好，又得继续改。如此反复，搞得人累不说，也很降低工作效率。

最后，每天从早上九点做到晚上十点左右，做的很累。而且，经常没有双休，真的很郁闷。

不管怎么样，还是在这个项目上花了两个多月的时间，虽然做的东西不够深入，但还是把做过的东西暂且记下来再说。

1.前端

前端这块，因为要做大量报表，本来准备自己做页面，后来使用报表软件FineReport时发现它自带了一个大数据决策系统。不过这个东西也很坑就是了，还得花钱。所以最后，前端这块主要就是用那个软件做报表。主要分为三步，使用sql语句查询数据库得到数据集，设置参数面板，制作报表。这里稍微熟悉了sql语句的使用，包括group by,in,substring和impala自带的一些函数等。

2.后端

后端这块，主要是做算法。这里我只负责了一个算法，决策树分类算法ID3。先从网上下的代码，使用之后发现这个算法只适合枚举类型，如果属性有数值型的并不合适。后来病急乱投医，从网上下了一个weka软件，导入输入数据，就可以得到决策树，然后写出分类规则。根据决策树写分类规则的代码在另一篇博文中有写，并没有技术含量，这里就不赘述了。然后，为了写毕业论文，我又自己装linux，搭hadoop，运行mahout单机版和分布式版，玩的也是不亦乐乎。最后说说我毕业论文中用到的算法，主要是基于用户的协同过滤算法和基于物品的协同过滤算法，以后有机会再贴上来。这也是在实际项目中第一次与算法打交道。通过这次学习，我深刻地认识到，算法的本质就是数学啊。所以，学好数学还是很重要滴。

3.其它

本人新手，不喜勿喷。通过这次项目，还零零总总地学习了一些其它的东西。比如，第一次装linux，linux命令的熟悉，第一次搭伪分布式hadoop平台，mapreduce的入门与熟悉，还有java的熟悉，eclipse的熟悉，等等。

总之，这次项目也学到了一点点东西。虽然不够深入，但也值得在此做个总结，以备后面继续学习，在大数据和机器学习方面继续深造。另外，项目中有些代码上传到github主页上去了。以后有机会，再把我的github主页贴上来。

sunwhut333

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
华科图书馆项目总结

仔细想想，华科图书馆的这次项目，还是职业生涯的处女秀。然而这次项目，却不是那么顺利，经历了很多不快。首先，可以发现给学校做项目是多么的麻烦，钱不多事还不少。其次，这次着实被需求坑了一把。以前只是在课堂上了解了一下，这次亲身体会了。甲方动不动就改需求，是多么蛋疼的一件事。而且每次只提一点需求，所以昨天做好的东西，今天要改；明天又说今天哪里做的不好，又得继续改。如此反复，搞得人累不说，也很降低
复制链接

扫一扫

专栏目录