- 博客(9)
- 收藏
- 关注
原创 大数据入门
通过大数据的诞生我们可以发现:大数据的出现,本质上是为了解决海量数据的处理难题大数据就是:使用分布式技术完成海量数据的处理,得到数据背后蕴含的价值但这种定义只是狭义上的一种解释,也就是这是一种技术思维上的定义而什么才是广义上的大数据呢,范围就比较大了,总结为五个字就是:数字化时代我们结合上述再次对大数据的定义进行归纳总结,什么是大数据?狭义上:大数据是一类技术栈,是一种用来处理海量数据的软件技术体系广义上:大数据是数字化时代、信息化时代的基础(技术)支撑,以数据为生活赋能分布式数据存储。
2023-09-20 15:16:58 96 1
原创 MongoDB 常用命令小结
修改数据:db.user.update({条件},{修改后的数据}) 或db.user.update({条件},{$set:{要修改部分的字段:数据})包含查询:db.user.find({字段名:{$in:[值1,值2]}})或db.comment.find({字段名:{$nin:[值1,值2]}})条件连接查询:db.user.find({$and:[{条件1},{条件2}]})或db.user.find({$or:[{条件1},{条件2}]})条件查询数据:db.user.find({条件})
2023-09-13 20:33:14 85
原创 NoSQL(非关系型数据库)概述及分类
NoSQL,泛指非关系型的数据库,NoSQL去掉关系数据库的关系型特性,数据之间无关系,非常容易扩展NoSQL型数据库一般包含一些共同特性:易扩展NoSQL数据库种类繁多,但是一个共同的特点都是去掉关系数据库的关系型特性。数据之间无关系,这样就非常容易扩展,在架构的层面上带来了可扩展的能力大数据量,高性能NoSQL 数据库都具有非常高的读写性能,尤其在大数据量下。一般 MySQL 使用 Query Cache。
2023-09-10 14:44:18 222 1
原创 Spark
定义:Apache Spark是用于大规模数据(large-scala data)处理的统一(unified)分析引擎简单来说,Spark是一款分布式的计算框架,用于调度成百上千的服务器集群,计算TB、PB乃至EB级别的海量数据Spark作为全球顶级的分布式计算框架,支持众多的编程语言进行开发而Python语言,则是Spark重点支持的方向Spark对Python语言的支持,重点体现在Python第三方库:PySpark之上PySpark是由Spark官方开发的Python语言第三方库。
2023-08-11 10:27:57 128 1
原创 Spring框架学了不会应用?一篇文章让你深度了解SpringBean的配置
一般情况下,单例作用范围,spring容器加载完成后就会立刻获取实例化对象,如果配置lazy-init="true",则不会立刻创建bean实例对象,等到执行getBean方法时创建实例化对象,然后将其存入单例池,后续获取该对象时从单例池中获取,本质上Bean仍为单例。注:Bean的销毁和Bean的销毁方法的调用不是同一个概念,Bean的销毁是指spring容器已被销毁,其维护的Bean对象也被销毁,而有时spring容器已经被销毁但spring也未执行到调用销毁方法的步骤。
2023-02-22 13:04:11 134
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人