- 博客(4)
- 收藏
- 关注
原创 认识Hadoop
在这一背景下,Hadoop应运而生,凭借其高效、稳定、可扩展的特性,成为了大数据领域的佼佼者。Hadoop作为大数据领域的佼佼者,以其高效、稳定、可扩展的特性,为用户提供了强大的数据处理能力。希望通过本文的介绍,读者能够对Hadoop有更深入的了解,并激发对大数据领域的兴趣和热情。同时,还需要了解Hadoop的生态系统,包括HDFS、MapReduce、HBase、Hive、Spark等组件。Hadoop以其高效、可靠、可伸缩的特性,为用户提供了强大的数据处理能力。
2024-06-12 14:18:03 450
原创 期末网络爬虫一课一得
网络爬虫(也称为网络蜘蛛)是一种在互联网上搜索和索引内容的机器人。从本质上讲,网络爬虫负责理解网页上的内容,以便在进行查询时检索它。网络爬虫通过发现 URL 以及查看和分类网页来工作。在此过程中,他们会找到指向其他网页的超链接,并将它们添加到接下来要抓取的页面列表中。网络爬虫很聪明,可以确定每个网页的重要性。搜索引擎的网络爬虫很可能不会爬取整个互联网。相反,它将根据包括多少其他页面链接到该页面、页面浏览量甚至品牌权威等因素来决定每个网页的重要性。
2023-12-28 09:44:58 1442 1
原创 期末java一课一得
Java是一门的编程语言,不仅吸收了语言的各种优点,还摒弃了C++里难以理解的多继承、等概念,因此Java语言具有功能强大和简单易用两个特征。Java语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员以优雅的思维方式进行复杂的编程。Java具有简单性、面向对象、、平台独立与可移植性、、动态性等特点。Java可以编写、Web应用程序、和应用程序等。
2023-12-25 10:37:25 90 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人