自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Hadoop知识总结

1.1什么是Hadoop:Hadoop是一个开源的、可靠的、可伸缩的、用于处理大数据的分布式计算框架。1.2常见的知识点概括:Hadoop HDFS(Hadoop Distributed File System):Hadoop集群中的存储系统,用于大数据的分布式存储。Hadoop MapReduce:Hadoop的原始计算模型,用于并行处理大量数据。Hadoop YARN(Yet Another Resource Negotiator):Hadoop集群中的资源管理系统,用于管理集群中的计算资源。

2024-04-27 19:57:45 690 2

原创 python知识分享

数据分析的概念:数据分析是利用数学,统计学理论与实践相结合的科学统计分析方法,对Excel数据,数据库中的数据,收集的大量数据,网页抓取的数据进行分析,从中提取有价值的信息并形成结论进行展示的过程。广义的数据分析包括狭义数据分析和数据挖掘。狭义数据分析通过数据的统计分析发现数据中的信息,分析数据结果背后的原因。数据挖掘则是通过数学算法和模型挖掘数据潜在规律,还可以预测数据的未来走向。

2023-12-22 10:25:28 910

原创 网络爬虫still

随着互联网信息的“爆炸”,网络爬虫渐渐为人们所熟知,并被应用到了社会生活的众多领域。网络爬虫又称网络蜘蛛/网络机器人,它是一种按照一种规则,自动浏览万维网的程序或脚本。通俗的讲,网络爬虫就是一个模拟真人浏览万维网行为的程序,这个程序可以代替真人自动请求万维网,并且接收从万维网返回的数据。网络爬虫经历几十年的发展,技术变得更加多样化,并结合不同的需求衍生出类型众多的网络爬虫。网络爬虫按照系统结构和实现技术大致可以分为4种类型,分别是通用网络爬虫/聚焦网络爬虫/增量式网络爬虫/深层网络爬虫。

2023-12-21 10:55:04 1509

原创 Java,学校作业,知识收获

Oracle 甲骨文中国提供全面的集成云平台和云服务,以创新型软件即服务 (SaaS)、平台即服务 (PaaS)、基础设施即服务 (IaaS) 和数据即服务 (DaaS) 技术助力企业发展。7.在JAVA中整数的默认为int类型,浮点数默认为double类型;2.创造者,推出JAVA语言公司:Sun公司;14.使用 Java语言编写的源程序保存时的文件扩展名是:.java。3.语言特点:简单性,面向对象,分布性,平台无关性,多线程。6.常量与变量的特点为:常量只能一次赋值,变量可以多次赋值。

2023-12-04 15:07:47 627 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除