云计算与大数据的总结
1)大数据主要侧重于数据的处理,流数据、批量数据、图计算等。在数据处理过程中,批量的数据处理的代表工具是Hadoop,流数据的数据处理代表的是Storm技术,而图计算这种密集型的代表是Spark,Spark对于迭代算法的处理很有效。
2)无论是Hadoop还是Spark的架构原理都侧重于分为三部分:资源的管理、服务计算状态的监控、服务的运行。把数据处理、数据处理监控和资源管理分开,可以更容易地进行分布式系统的扩展。
3)主要从数据的存储、数据的处理和数据的应用三个方面进行介绍,每一个方面结合现在的热门工具进行实情实景的分析。
4)我觉得印象最深的部分是关于机器学习和深度学习的,和常规对算法的认识不同
5)最后一章电子商务与社会网络大数据分析,主要介绍了电子商务网站的推荐算法、推荐算法中数据的归一化处理和距离度量、相似度度量等
学如逆水行舟 不进则退我要继续努力 感谢老师这一学期的付出