自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Hadoop知识点

Hadoop是什么呢?Hadoop是一个由Apache基金会所开发的分布式系统基础架构,它允许用户在不需要深入了解分布式底层细节的情况下,开发分布式程序,并充分利用集群的威力进行高速运算和存储。Hadoop的核心设计主要包括分布式文件系统(HDFS)和MapReduce编程模型。HDFS是Hadoop的分布式文件系统,具有高容错性,并设计用来部署在低廉的硬件上。它提供高吞吐量来访问应用程序的数据,特别适合处理超大数据集。HDFS放宽了POSIX的要求,能以流的形式访问文件系统中的数据。

2024-04-18 18:30:42 886 2

原创 爬虫知识点

网络爬虫的实现技术主要有PHP、Go、C++、Java、Python。PHP 语言的优点是语法简洁,容易上手,拥有丰富的网络爬虫功能模块;缺点是对多线程的支持不太友好,需要借助扩展实现多线程技术,并发处理的能力相对较弱。Go语言的优点是高并发能力强、开发效率高、丰富的标准库通过Go语言开发的网络爬虫程序性能更好,缺点是普及性不高。C++ 语言的优点是运行速度快、性能强;缺点是学习成本高代码成型速度慢。Java在网络爬虫方向已经形成了完善的生态圈,非常适合开发大型网络爬虫项目,但重构成本比较高。

2023-12-09 10:43:29 1062

原创 Python数据分析与可视化知识点

Pandas库中提供连接Mysql等数据库的方法,可以在python读取数据库中的结构化数据。利用pandas库从外部读取数据到python中形成的表格叫做DataFrame表格对象。当使用条件查询等对部分行数据进行筛选的方法时,会导致新的表格对象的索引不连续。describe():对表格对象中的数字型序列进行各类统计量的计算。Series序列对象即DataFrame表格对象中的某一列数据。导入数据库表格或者excel数据时形成的数据对象就是表格对象。语法: 表格对象['新的列名'] = 某个序列对象。

2023-12-03 20:46:55 861 1

原创 Java难懂的知识点

下标也叫索引(Index),用来指出某个元素在数组中的位置数组中第一个元素的下标默认为0,第二个元素的下标为1,依次类推。continue语句:用于终止本次循环,跳过该循环体中位于continue后面的语句,进入下次循环用于循环语句中,类似于break语句,常与条件语句一起使用。数据类型符[ ][ ] 数组名=new 数据类型符[ ][ ] {初值列表1},...,[初值列表n}①数据类型符[ ][ ] 数组名= new 数据类型符[长度1] [长度2];数据类型符[ ] 数组名 ={初值列表};

2023-10-22 22:01:26 73 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除