- 博客(4)
- 收藏
- 关注
原创 大数据之Hadoop初学者
因为绝大多数的企业,都是将Hadoop运行在linux上,而在众多的开源的linux发行版中,red hat(红帽子)的Centos又是最为流行的)Hadoop底层维护了多个数据副本,所以即使某一个单元出现故障,也不会导致数据丢 失,并且拥有按位存储和处理数据的能力。在网络中,可以通过IP通信,因此,在集群中,如果想要通过主机名通信,则还要设置IP来与之对应,类似于域名要绑定IP。登出,再重新登录,用户名已经改变,由上次改成的aaa,变成了刚刚改成的804787-hadoop01。
2024-04-24 21:18:24
1523
1
原创 初学python网络爬虫之数据解析篇
在当今的信息时代,数据已经成为了一种宝贵的资源。网络爬虫作为一种获取数据的重要手段,可以帮助我们从海量的互联网信息中提取出有价值的数据。而数据解析则是将爬取的数据转化为可理解和可利用的信息的过程。要想过滤网页的数据,首先要对服务器返回类型的数据形式做一些了解,这些数据一般分为两种。
2023-12-25 14:58:08
1662
原创 初学python数据分析与可视化
数据可视化通过将数据以图形或图像的形式展示出来,用户可以更直观地了解数据的分布、趋势和关系,帮助用户更好地理解和分析数据,从而更好地理解数据背后的规律和意义。matplotlib是Python基础的画图库 ,在案例地址中介绍了很多种类的图和代码示例。pandas是在matplotlib的基础上实现画图的,pandas提供了大量的高级数据操作工具,如索引、切片、聚合、转换、筛选等,相关信息在官网。matlpotlib和pandas结合。
2023-12-22 11:19:36
1764
原创 java小知识
Scanner 对象名=new Scanner(System.in)> 算术运算符 > 关系运算符 > && > || > 赋值运算符。把取值范围大的数据转换为取值范围小的数据过程即为显示类型转换(可能数据丢失)对象名.nextDouble(): 读入double类型值。对象名.nextLine() : 读入字符串。在类的外面,代码行顶部引入包(可以自动引入包,只做一次。任何变量在使用前,必须先定义,后使用,要注意赋初值。对象名.nextInt(): 读入整数值。余数的符号与取余运算符左边操作数符号相同。
2023-12-09 22:42:35
398
6
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人