- 博客(4)
- 收藏
- 关注
原创 Hadoop核心技术
Hadoop生态系统是一个开源的分布式计算平台,由Apache软件基金会开发并维护。其核心组件主要包括HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)、MapReduce以及YARN(Yet Another Resource Negotiator,另一种资源协调者)。这些组件共同构成了Hadoop分布式计算框架的核心,为用户提供底层细节透明的基础框架。* HDFS是Hadoop的分布式文件系统,旨在在廉价硬件上存储大型文件。
2024-05-11 10:51:02 1110 2
原创 网络爬虫基础
通用网络爬虫 ( General Purpose Web Crawler ) 又称全网爬虫 (Scalable Web Crawler) ,是指访问全互联网资源的网络爬虫。通用网络爬虫是“互联网时代”早期出现的传统网络爬虫,它是搜索引擎 (如百度、谷歌、雅虎等)抓取系统的重要组成部分,主要用于将互联网中的网页下载到本地,形成一个互联网内容的镜像备份。
2023-12-26 15:19:57 1996 1
原创 数据可视化:pyecharts简单实例
1、Ppyecharts简介:Echarts是一个由百度开源的基于js语言的数据可视化框架,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。由于python在数据分析领域的活跃,一个开放团队将echarts库移植到Python中,命名为“pyecharts”相较于matplotlib而言,pyecharts库绘制的图形种类更多,样式更加精美、丰富。2、pyecharts团队提供了官网和社区。
2023-12-21 10:36:28 1362
原创 Java数组简单基本内容
从键盘上输入10个数,放入一个一维数组中,然后将其前5个元素与后5个元素整体对换,即第1个元素与第6个元素对换,第2个元素与第7个元素对换,........第5个元素与第10个元素对换,分别输出对换前数组各元素的值和对换后各元素的值。把上面两组数分别读入两个一维数组中,先输出这两个数组的值然后把两数组中对应下标的元素相加,并把相应结果放入第三个数组,最后输出第三个数组的值。要是把他们分开会产生语法错误。数据类型符[][]数组名=new 数据类型符[][]{{初值列表1},.....,{初值列表n}}
2023-11-26 13:51:03 816 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人