2016总结

最新推荐文章于 2017-02-07 15:09:34 发布

杨铖

最新推荐文章于 2017-02-07 15:09:34 发布

阅读量844

点赞数 7

文章标签： 2016 总结

本文链接：https://blog.csdn.net/yc_1993/article/details/54675668

版权

总结专栏收录该内容

4 篇文章 0 订阅

订阅专栏

Preface
2016年过得总算是有惊无险。

直到昨天，过了公司年会后，觉得才算是过了2016，这一年，从一个学生，转变成了一名员工，角色的蜕变总觉得在不经意间。

3月份，搞定毕业论文，拿了个优秀论文，觉得还是做自己喜欢的东西好，虽说论文跨了专业甚至跨了领域，但是得到认可还是蛮欣慰。

6月份没什么意外顺利毕业。

毕业后留在了实习公司，15年11月份至今，其实学到了挺多的。

实习时很多时间是做可视化，R，Echarts这些当时都捣鼓得挺熟的。

看了很多R的书，基本上把当时市面上关于R的都大概看了：
R语言核心技术手册(第2版)
R语言编程艺术
ggplot2:数据分析与图形艺术
时间序列分析及应用:R语言(原书第2版)
机器学习与R语言
R语言与数据挖掘最佳实践和经典案例
数据挖掘:R语言实战
R语言与网站分析
但是平心而论，核心手册，编程艺术和ggplot2这三本是帮助最大的，特别是ggplot2，基本上整个论文所有的可视化图表以及后来的做算法的可视化，都是基于ggplot2.

除了R，由于接触到的数据越来越大，传统的串行算法在处理上有点吃力，就开始学scala这门语言，学习spark这个框架，主要是针对spark ML库，看了几步书：
programming in scala
快学scala
scala函数式编程
不得不说，scala真是一门会上瘾的语言，也很难学。

此外，由于本机环境的限制，工作后会linux的要求越来越高，不得不开始也着手linux，练习就在本地虚拟机下centos操作，鸟哥的Linux私房菜，写得着实不错。

最后，由于公司一些产品慢慢涉及到深度学习框架，python也不得撸袖上手，看了python核心编程前14章，与之前学的语言关联起来，确实容易上手。

当然，以上只是工具篇，工具慢慢用就熟了，但是本职做数据挖掘/机器学习，确实得日夜兼顾才能有所体会，有所提高。

这一年主要是与李航博士的统计学习方法，还有传说中的ESL为伍。
基本上动手实现了统计学习方法里面的大部分，ESL则越读越有启发。

只是，以上是下班后回家看的，这样明显不够，做产品开发时，没仔细统计，应该读过100篇论文，且有一些反复读不止10次，有一段时间做一个定位项目，每天到公司第一件事就是点开昨晚看不完的论文，这种状态持续了大概2-3个月，庆幸的是，后来从开方，测试，优化到部署，都是挺顺利的，也申请了个专利，觉得辛苦但是看到效果还是蛮开心的。

后来把机器学习用到本领域，也做了大大小小的几个产品，从无监督到监督，从简单的贴合业务能自动寻找k的kmeans，到稍微复杂的在线实时SVR做计算，等等，所有最终做成的产品，都是手把手撸出来，不调用任何第三方库。

最后，nupic框架HTM算法做异常检测着实不错，但是资料能不能多点呢，numenta的boss们。

2016大概就是这样
2017希望的就是保持这种状态就好，就这样。