一、hive
hive只适合用来做批量数据统计分析,是披着sql数据库外衣的批量统计分析系统。将结构化的文件映射为一张数据库表,用于查询,类似于血缘分析。
Hive详细介绍及简单应用
示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
二、RDBMS
关系型数据库管理系统,DBMS是数据库管理系统,DBMS只适合处理少量的数据,而关系型数据库之间的关系是由主键和外键相互联系的table来构成。
三、MapReduce
一个即将退伍的map和reduce的合并罢了。hive可以减少使用mapreduce的人工成本。
四、机器学习入门
特征数=维度^2/2,一张5050像素的照片,它的维度是5050=2500,特征数=2500*2500/2=3,125,000。如果是彩色图片,维度会增加到原来的3倍,那么特征数将增加到接近3千万。
机器学习入门——浅谈神经网络
1.贝叶斯优化调参-Bayesian optimiazation原理加实践
调参神器,基于高斯过程。不确定是否和贝叶斯VAR模型有联系?或者说数学原理是通用?
贝叶斯优化调参-Bayesian optimiazation原理加实践
总结
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。