自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 Hive安装教程

前置条件:hadoop&mysql以下的/opt/bigdata目录根据自己实际情况更改。

2024-05-25 15:12:03 596

原创 docker容器安装mysql

下载指定版本的mysql: sudo docker pull mysql:5.7。根据关键字搜索镜像: sudo docker search mysql。停止正在运行的容器:sudo docker stop 容器编号。删除正在运行的容器:sudo docker rm 容器编号。-d mysql:5.7 : 后台运行mysql5.7。查看正在运行的容器:sudo docker ps -a。--name mysql: 运行服务的取名。-v是将主机目录下的文件挂载到容器中路径下。

2024-05-24 21:59:01 794

原创 Linux安装教程 (centOS-7)

VMware Workstation Pro下载。

2024-05-24 18:22:29 601

原创 zookeeper安装教程

zookeeper安装教程

2024-05-21 12:50:46 730

原创 (图文并茂)基于CentOS-7搭建hadoop3.3.6大数据集群

安装虚拟机等很久没反应一般是需要按 Enter键 确认进入安装界面。

2024-05-15 18:20:17 1791

原创 spark实验求TOP值

已知存在两个文本文件,file1.txt和file2.txt,内容分别如下:file1.txtfile2.txt以上两个文件所存储的数据字段的意义为:orderid, userid, payment, productid。

2024-04-24 19:02:34 1449

原创 spark3.0.0单机模式安装

添加以下内容,/bigdata/hadoop就是hadoop的路径,可根据自己的实际情况修改。下载spark3.0.0版本,hadoop和spark版本要对应,否则会不兼容。用xftp上传Linux虚拟机,上传目录/bigdata(可修改)注:此安装教程基于hadoop3集群版本。这是一个求Π的示例程序,输出如下。打开spark shell终端。修改spark配置文件。

2024-04-24 14:35:40 615 1

原创 蓝桥杯-求阶乘-python

不难看出,5的个数是最后一个数除以5的商(直至不够除5,因为有些数包括多个5,例如25,包含了两个5)在求阶乘的过程中,只要是偶数就会有2,而5相对2更少,所以对于10的数量我们可以用计算5的数量来代替。1-5,1-10,1-15,1-20,1-25,分别有1,2,3,4,5+1个5。对于非5倍数,我们考虑最接近该数的小于他的5的倍数,换一个说法,但是二分法查找的不仅仅是5的倍数,因此我们要考虑非5的倍数。末尾的0是由10产生的,而10是由质数2和5产生的。因为要求的N要求最小,即N一定是5的倍数。

2024-02-04 14:07:25 501

原创 蓝桥杯-“山”形数字个数(python版)

例如:12221,取前两位12,奇数位的数有12221、12321、12421、12521、12621、12721、12821、12921,【2~9,即9-2+1个,加1是因为2本身也是可以满足条件的】即有。对于区间[2022,2022222022]中的数,我们只需要考虑到区间[2222,199999991],所以对半区间是。这段代码只考虑了山形数的位数是偶数的情况,例如2332,56788765,而没有12321这种。对于回文,因为是对称的(类似照镜子),所以我们只需要对一半数字考虑单调性。

2024-02-03 21:54:59 508 1

原创 利用不同工具实现网络爬虫

BS4)是Python的一个第三方库,用来从HTML和XML中提取数据。在某些方面比XPath易懂,但是不如XPath简洁,而且由于它是使用Python开发的,因此速度比XPath慢。安装。

2024-01-07 20:27:49 1340

原创 简单实现不同电脑之间的文件共享

简单实现不同电脑之间文件共享

2024-01-05 10:15:02 412

原创 python简单爬虫

的多进程库,用来处理与多进程相关的操作。但是由于进程与进程之间不能直接共享内存和堆栈资源,而且启动新的进程开销也比线程大得多,因此使用多线程来爬取比使用多进程有更多的优势。post提交的数据在请求体中,因此不能直接通过拼接url的形式访问网页资源。方法,可以让线程池里面的所有线程都“同时”执行一个函数。post提交的数据要借助data或json参数。类,它用来实现线程池。

2024-01-01 17:09:45 907

原创 在Python中使用正则表达式

数据在实际开发中是从各种平台爬取获得,爬取的数据可以直接进行正则表达式过滤,也可先保存到文本文件中再做处理。re.S忽略换行符,一般情况下只会匹配到字符串结尾或换行符前面,加上re.S参数后即可匹配换行符后面的内容。的时候,才会把正则表达式里面的括号中的结果打印出来。只返回第一个匹配到的结果,只要开头没有匹配上就结束匹配。根据正则表达式的写法,设计所需要的匹配规则。2个括号中的内容,以此类推。括号的情况下)的形式展示。获取第一个匹配上的字符串。个括号中的内容,参数为。获取所有匹配的字符串。

2023-12-31 16:57:01 459

原创 python读写文件操作

这里有一个参数“encoding”,它可以在打开文件的时候将文件转换为UTF-8编码格式,从而避免乱码的出现。如果文件是在Windows中创建的,并且使用UTF-8打开文件出现了乱码,可以把编码格式改为GBK。CSV文件本质上是文本文件,所以操作csv文件需要先以文本文件方式打开,再将文件对象传递给CSV模块。写列表的时候,Python写到文本中的文字是不会自动换行的,需要人工输入换行符才可以。参数为一个列表,把列表里面的所有字符串写入到文本中。准备字典类型的数据,包含字典的列表也可以。

2023-12-31 16:54:48 436

原创 正则表达式

我的微博密码是:1234567,QQ密码是:33445566, 银行卡密码是:888888,Github密码是:999abc999,帮我记住它们。: 假设我们要匹配包含"apple"的单词,但只有在"apple"后面不跟着"pie"的情况下才匹配。“1234567,QQ密码是:33445566, 银行卡密码是:888888,Github密码是:999abc999” (长度。:apple(第二个"apple"匹配成功,因为它后面不跟着"pie")

2023-12-31 15:24:50 358

原创 蓝桥每日一题--修剪灌木

而回去的方向有两种,向左和向右,我们只需计算这个灌木距离左边端点和右边端点的距离,取长的一个,因为是往返,再乘以2即可得出最远距离,这个即为每个灌木可以长到的最高高度。爱丽丝修剪灌木的顺序是从最左侧的灌木开始,每天向右修剪一棵灌木。当修剪了最右侧的灌木后,她。某灌木长到的最高高度可以看作爱丽丝回到这个灌木的距离(爱丽丝的速度和数生长的速度一致),,下一天开始向左修剪灌木。直到修剪了最左的灌木后再次调转方向。输出N行,每行一个整数,第1行表示从左到右第i棵树最高能长到多高。爱丽丝要完成一项修剪灌木的工作。

2023-12-25 13:51:29 350 1

原创 第五届计挑Java决赛真题之求三角形面积

参加比赛,遇到一到计算三角形面积的题,大概是这样,没截图给出直角坐标系第一象限中的不重复的n个点,在这n个点中选取三个点,求这三个点能组成的三角形的最大面积思路是直接暴力求解,遍历所有点,三次方的时间复杂度接下来就是求面积,最重要的应该是会求面积感觉这题就是考数学知识的,梦回高中。

2023-12-22 00:15:41 375

原创 python第四届蓝桥省赛--幸运数

这时,3为第2个幸运数,然后把所有能被3整除的序号位置的数删去。数组的大小:对于1~n之间的幸运数个数,我们只需要求n以内的幸运数,所以nums = [i for i in range(1,n)],这里不包括n。取m~n之间的幸运数:只需求1~n之间的幸运数,再取其中大于m且小于n的幸运数即可。对于其他幸运数,往后每一个数的下标+1对幸运数取余,余数为0则删除。直接用模拟,先求1~n之间的幸运数,最后取m~n之间的幸运数。第一个幸运数需要特殊处理,第一个幸运数为1,但基准序号为2。1 就是第一个幸运数。

2023-12-16 23:59:42 446 1

原创 python第五届蓝桥省赛--蚂蚁感冒

接着的一行是n个用空格分开的整数 Xi (-100 < Xi < 100), Xi的绝对值,表示蚂蚁离开杆子左边端点的距离。正值表示头朝右,负值表示头朝左,数据中不会出现0值,也不会出现两只蚂蚁占用同一位置。并且在和其它蚂蚁碰面时,会把感冒传染给碰到的蚂蚁。其实蚂蚁掉不掉头都无所谓,因为速度相等,感冒后的蚂蚁相遇,两只蚂蚁都感冒了,原本感冒的蚂蚁 转向后 可以看作 被传染的蚂蚁转向,然后继续按原方向前进。请你计算,当所有蚂蚁都爬离杆子时,有多少只蚂蚁患上了感冒。第二种情况:感冒蚂蚁传染了往右走的蚂蚁。

2023-12-16 13:30:58 636 1

原创 pythonIDLE使用技巧

蓝桥杯python环境只能使用python自带的IDLE,因此写了这篇博客,让自己更熟悉IDLE的使用。

2023-12-15 13:22:56 827

原创 python第十二届蓝桥省赛真题--时间显示

也就是那些凑不出整的天数、小时数、分钟数的“只输出时分秒,可以直接计算。也可以直接调用库函数。

2023-12-13 22:50:26 429 1

原创 python第十二届蓝桥省赛真题--砝码称重

在这个问题中,我们需要找到所有可能的重量状态,因此广度优先搜索算法可以确保在最短步数内找到所有可能的状态,从而得到问题的解。因此,这个问题可以使用广度优先搜索算法来逐步计算可以称出的不同重量的数量,确保在最短步数内找到所有可能的重量状态,从而得到问题的解。在题目中要求的是不同重量,但存在不同砝码组合组成相同重量,这时我们可以用集合存储可以称出的重量,以免重复计数。另外,这个问题中我们需要找出可以称出的不同重量的数量,而广度优先搜索算法适用于需要找到。我们需要逐步考虑每个砝码的重量,然后计算在。

2023-12-13 22:30:32 503 1

原创 java.lang.NumberFormatException: empty String

servlet报500 空字符串问题解决

2023-11-06 20:03:16 288

原创 蓝桥杯第十三届JavaB组省赛真题-最少刷题数

小蓝老师教的编程课有 N 名学生,编号依次是 1 . . . N。第 i 号学生这学期刷题的数量是 Ai。对于每一名学生,请你计算他至少还要再刷多少道题,才能使得全班刷题比他多的学生数不超过刷题比他少的学生数。输出 N 个整数,依次表示第 1 . . . N 号学生分别至少还要再刷多少道题。第二行包含 N 个整数:A1, A2, A3, . . . , AN.(注意临界点,当当前学生刷题数为0时需特殊处理)第一行包含一个正整数 N。求出每个刷题数阶段的人数,可以用暴力,但是在寻找。

2023-11-06 12:19:36 286

原创 蓝桥杯第十三届省赛Java大学B组模拟--字符统计

给定一个只包含大写字母的字符串 S,请你输出其中出现次数最多的字母。如果有多个字母均出现了最多次,按字母表顺序依次输出所有这些字母。一个只包含大写字母的字符串 S .样例输入:BABBACAC。若干个大写字母,代表答案。

2023-11-04 22:43:25 107 2

原创 轻松理解Java序列化 反序列化、反射、动态代理、注解

Target 注解作用域(类、方法...)@Retention 注解有效时间范围@Target()public @interface 注解名称{public 属性名称 属性名() default 默认值;

2023-10-20 22:44:09 163 1

原创 linux图形化界面和字符界面的转换

由命令行模式更改为图形界面模式。由图形界面模式更改为命令行模式。

2023-09-18 20:10:00 642

原创 display常用属性

display:none 、block、inline 、inline-block

2023-04-05 16:50:54 433

原创 Linux文件查找

find并不常用,因为其速度较慢,一般使用which和whichis、locate(可模糊查找),速度快(寻找范围小)

2023-01-02 17:02:43 578

原创 linux文件操作

linux文件和目录操作

2022-12-30 20:19:03 157

原创 linux文件权限设置

linux文件权限操作

2022-12-29 19:03:15 18299 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除