- 博客(35)
- 资源 (13)
- 收藏
- 关注
原创 八皇后问题简单处理(dfs版,搜索+回溯)
对于某个满足要求的8皇后的摆放方法,定义一个皇后串a与之对应,即a=b1b2…已经知道8皇后问题一共有92组解(即92个不同的皇后串)。如何将8个皇后放在棋盘上(有8×8个方格),使它们谁也不能被吃掉!这就是著名的八皇后问题。给出一个数b,要求输出第b个串。串的比较是这样的皇后串x置于皇后串y之前,当且仅当将x视为整数时比y小。第1行是测试数据的组数n,后面跟着n行输入。每组测试数据占1行,包括一个正整数b(1≤b≤92)。输出有n行,每行输出对应一个输入。输出应是一个正整数,是对应于b的皇后串。...
2022-07-28 14:54:38 201
原创 matplotlib利用函数简单绘制心形曲线2022.8.30
想了半天,原来power不能直接开2/3{以后不在这个种问题上纠结了,想了12个小时笑死我了}**也是直接指定指数就行。
2022-08-30 17:40:52 384 1
原创 简单的高精度除以高精度
时间限制1000ms内存限制65536KB。提交数14176通过数6917。高精除以高精,求它们的商和余数。输入两个低于300位的正整数。
2022-07-28 14:48:56 359
原创 An Easy Problem贪心算法,最简单做法
/////举个例子,假如给定的N为78,其二进制表示为1001110,包含4个1,那么最小的比N大的并且二进制表示中只包含4个1的数是83,其二进制是1010011,因此83就是答案。//////给定一个正整数N,求最小的、比N大的正整数M,使得M与N的二进制表示中有相同数目的1。//////提交数8902通过数6267。//////输出若干行对应的值。//////【题目描述】//////【输入样例】//////【输出样例】//////【输入】//////【输出】...
2022-07-28 14:37:09 281
原创 计算机网络一小时总结 明天考试
1.在计算机网络中,internet 和 Internet 的含义是一样的。 ( F)1.internet(互联网或互连网):通用名词,它泛指由多个计算机网络互连而 成的网络;协议无特指。2.Internet(因特网):专用名词,特指采用 TCP/IP 协议的互联网络。 区别:后者实际上是前者的双向应用2.在计算机网络中,带宽用来表示网络中 某通道 传送数据的能力。表示在单位时间内网络中的某信道所能通过的“最高数据率”。 (T )在网络设备和带宽中使用的单位均为bps。bps是【bit per s
2022-06-26 20:46:21 2005
原创 14. DataFrame
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0PH9hGCO-1655396298057)(assets/1653400255144.png)]上图直观地体现了DataFrame和RDD的区别。DataFrame是基于RDD之上的分布式数据集,给予Schema信息。(1)数据准备,在/opt/module/spark-local目录下创建一个user.json文件(2)查看Spark支持创建文件的数据源格式,使用tab键查看(3)读取json文件创建DataFrame
2022-06-17 00:18:34 383
原创 13.Storm框架应用
在介绍Storm之前,我们先看一个日志统计的例子:假如我们想要根据用户的访问日志统计使用斗鱼客户端的用户的地域分布情况,一般情况下我们会分这几步:取出访问日志中客户端的IP把IP转换成对应地域按照地域进行统计如果有时效性要求呢?小时级:还行,每小时跑一个MapReduce Job10分钟:还凑合能跑5分钟 :够呛了,等槽位可能要几分钟呢1分钟 :算了吧,启动Job就要几十秒呢秒级 :… 要满足秒级别的数据统计需求,需要进程常驻运行;数据在内存中Storm正好适合这种需求。Storm vs. MapReduc
2022-06-17 00:17:57 233
原创 12.SparkSQL概述
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-g7Xrat4M-1655396200675)(assets/1653210188965.png)]Spark SQL是Spark用于结构化数据(structured data)处理的Spark模块。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EB5w3gRG-1655396200677)(assets/1653223225529.png)]SparkCore:RDD -> 取代 Ma
2022-06-17 00:16:53 166
原创 11.RDD行动算子
函数签名函数说明1.3 collect函数签名函数说明函数实例1.4 count函数签名函数说明返回RDD中元素的个数实例1.5 first函数签名函数说明返回RDD中的第一个元素实例1.6 take函数签名函数说明函数实例1.7 takeOrdered函数签名函数说明返回该RDD排序后的前n个元素组成的数组函数实例1.8 aggregate函数签名函数
2022-06-17 00:16:22 115
原创 10.RDD用法
函数签名函数说明用法1.3 mapPartitions方法函数签名函数说明小功能:获取每个数据分区的最大值[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-w0ka0mjo-1655396109919)(assets/clip_image002.jpg)] 思考一个问题:map和mapPartitions的区别?数据处理角度Map算子是分区内一个数据一个数据的执行,类似于串行操作。而mapPartitions算子是以分区为单位进行批处理操作。功能的角
2022-06-17 00:15:26 283
原创 9.RDD用法
从集合中创建RDD,Spark主要提供了两个方法:parallelize和makeRDD1.1.2 从外部存储(文件)创建RDD由外部存储系统的数据集创建RDD包括:本地的文件系统,所有Hadoop支持的数据集,比如HDFS、HBase等。1.1.3 从其他RDD创建主要是通过一个RDD运算完后,再产生新的RDD。1.1.4 直接创建RDD使用new的方式直接构造RDD,一般由Spark框架自身使用。2.2 RDD并行度与分区2.2.1 概述默认情况下,Spark可
2022-06-17 00:14:17 213
原创 8.RDD用法
RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据处理模型。代码中是一个抽象类,它代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。弹性分布式:数据存储在大数据集群不同节点上数据集:RDD封装了计算逻辑,并不保存数据数据抽象:RDD是一个抽象类,需要子类具体实现不可变:RDD封装了计算逻辑,是不可以改变的,想要改变,只能产生新的RDD,在新的RDD里面封装计算逻辑可分区、并行计算[外链图片转存失败,源站可能有防盗链机制,建议将图片保
2022-06-17 00:13:43 146
原创 7.Spark历史服务器配置及ha机制
1) 修改spark-defaults.conf.template文件名为spark-defaults.conf2) 修改spark-default.conf文件,配置日志存储路径注意:需要启动hadoop集群,HDFS上的directory目录需要提前存在。3) 修改spark-env.sh文件, 添加日志配置参数1含义:WEB UI访问的端口号为18080参数2含义:指定历史服务器日志存储路径参数3含义:指定保存Application历史记录的个数,如果超过这个值,旧的应
2022-06-17 00:12:26 277
原创 7.Spark历史服务器配置及ha机制
1) 修改spark-defaults.conf.template文件名为spark-defaults.conf2) 修改spark-default.conf文件,配置日志存储路径注意:需要启动hadoop集群,HDFS上的directory目录需要提前存在。3) 修改spark-env.sh文件, 添加日志配置参数1含义:WEB UI访问的端口号为18080参数2含义:指定历史服务器日志存储路径参数3含义:指定保存Application历史记录的个数,如果超过这个值,旧的应
2022-06-17 00:11:19 582
原创 6.Spark运行环境
Spark作为一个数据处理框架和计算引擎,被设计在所有常见的集群环境中运行, 在国内工作中主流的环境为Yarn,不过逐渐容器式环境也慢慢流行起来。接下来,我们就分别看看不同环境下Spark的运行将spark-3.0.0-bin-hadoop3.2.tgz文件上传到Linux并解压缩,放置在指定位置,路径中不要包含中文或空格1.2.3 启动Local环境进入解压缩后的路径,执行如下指令启动成功后,可以输入网址进行Web UI监控页面访问在解压缩文件夹下的data目录中,添加word.txt文件。
2022-06-17 00:10:10 174
原创 5.Spark框架入门
回顾Hadoop历史Spark历史hadoopHadoop是由java语言编写的,在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架作为Hadoop分布式文件系统,HDFS处于Hadoop生态圈的最下层,存储着所有的数据,支持着Hadoop的所有服务。它的理论基础源于Google的TheGoogleFileSystem这篇论文,它是GFS的开源实现。MapReduce是一种编程模型,Hadoop根据Google的MapReduce论文将其实现,作为Hadoop的分布式计算模型,是Hadoop的
2022-06-16 23:39:42 203
原创 4.Spark学习笔记(scala综合案例分析)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0CfK7v4n-1655393698247)(assets/1649650988285.png)]6.3 优化写法7. 作业练习题如何通过统计计算算出单词出现次数,使用reduce方法ount)}...
2022-06-16 23:35:53 493
原创 3.Spark学习笔记(高级集合用法)
3.1.2 基本操作3.2 可变List3.2.1 基本语法3.2.2 基本操作3.2.3 可变集合和不可变集合转换3.3 Set集合3.3.1 不可变Set3.3.1.1 创建不可变的Set3.3.1.2 基本操作3.3.2 可变Set3.3.2.1 基本语法3.3.2.2 基本操作3.4 Map集合3.4.1 概述Map(映射)是一种可迭代的键值对(key/value)结构。所有的值都可以通过键来获取。Map 中的键都是唯一的。3.4.2 不可变Map
2022-06-16 23:33:41 332
原创 2.Spark学习(集合用法)
可变集合可以在适当的地方被更新或扩展。这意味着你可以修改,添加,移除一个集合的元素。scala.collection.immutable[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0LUUC6OQ-1655393424628)(assets/1648536124515.png)]不可变集合类,相比之下,永远不会改变。不过,你仍然可以模拟添加,移除或更新操作。但是这些操作将在每一种情况下都返回一个新的集合,同时使原来的集合不发生改变,所以这里的不可变并不是变量本身的值不可变,
2022-06-16 23:30:56 418
原创 Spark学习笔记(面向对象编程)
Scala是一门完全面向对象的语言,摒弃了Java中很多不是面向对象的语法。虽然如此,但其面向对象思想和Java的面向对象思想还是一致的1.2 包用法1.2.1 基本语法Scala中基本的package包语法和Java完全一致1.2.2 scala包的特点可以让源码文件中多次使用package关键字源码物理路径和包名没有关系明确包的作用域,可以在package关键字的后面增加大括号同一个源码中,子包中可以直接访问父包中的内容scala可以将包当成对象来用可以直接声明属性和方法
2022-06-16 23:26:10 185
原创 7.读写HBase数据(华为云学习笔记,Spark编程基础,大数据)
读写HBase数据① 在hbase-shell中使用命令创建HBase数据库;② 使用Spark读写HBase数据库中的数据。实验原理-> HBaseHBase是一个高可靠、高性能、面向列、可伸缩的分布式数据库,主要用来存储非结构化和半结构化的松散数据。HBase的目标是处理非常庞大的表,可以通过水平扩展的方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表。-> hbase-shellhbase-shell是一种HBase交互式操作环境,可以在其中输入命令,完成数据库创建和
2022-06-13 15:57:13 804
原创 6.编写Spark独立应用程序(sbt)(华为云学习笔记,Spark编程基础,大数据)
编写Spark独立应用程序(sbt)① 使用Scala语言编写Spark独立应用程序;② 使用sbt工具对Spark应用程序进行编译打包。实验原理-> sbtSBT是一个现代化的构建工具。虽然它由Scala编写并提供了很多Scala便利,但它是一个通用的构建工具。可以使用sbt工具,对采用Scala语言编写的Spark应用程序进行编译打包。1. 安装sbt工具下载安装包请打开浏览器访问如下链接进行下载拷贝代码http://file.ictedu.com/fileserver/big_data_
2022-06-13 15:26:35 1518
原创 5.编写Spark独立应用程序(Maven)(华为云学习笔记,Spark编程基础,大数据)
实验拓扑图编写Spark独立应用程序(Maven)① 使用Scala语言编写Spark独立应用程序;② 使用Maven工具对Spark应用程序进行编译打包。实验原理-> MavenMaven是一个项目管理工具,它包含了一个项目对象模型 (Project Object Model),一组标准集合,一个项目生命周期(Project Lifecycle),一个依赖管理系统(Dependency Management System),和用来运行定义在生命周期阶段(phase)中插件(plugin)目标(
2022-06-10 16:21:29 1083 1
原创 4.在spark-shell中运行代码(华为云学习笔记,Spark编程基础,大数据)
在spark-shell中运行代码① 能够使用正确的方式启动spark-shell;② 能够在spark-shell中进行交互式编程。实验原理-> spark-shellspark-shell提供了简单的方式来学习 API,并且提供了交互的方式来分析数据。你可以输入一条语句,spark-shell会立即执行语句并返回结果,这就是我们所说的REPL(Read-Eval-Print Loop,交互式解释器),它为我们提供了交互式执行环境,表达式计算完成以后就会立即输出结果,而不必等到整个程序运行完毕,
2022-06-10 15:57:21 2140
原创 3.Spark的安装(华为云学习笔记,Spark编程基础,大数据)
Spark的安装① 在Linux系统中安装Spark;② 运行Spark自带实例。实验原理-> SparkApache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更
2022-06-10 11:29:19 424
原创 2.Scala的安装和使用方法(华为云学习笔记,Spark编程基础,大数据)
Scala的安装和使用方法① 在Linux系统中安装Scala;② 使用Scala REPL;③ 编译打包Scala程序代码。实验原理-> ScalaScala于2004年1月公开发布1.0版本,目前仍处于快速发展阶段,每隔几个月就有新的版本发布。Spark从2.0版本开始都采用Scala2.11编译,因为本教程使用的Spark版本是2.1.0,其对应的Scala版本是2.11.8,所以,本教程中的Scala选用2017年4月发布的2.11.8版本。Scala运行在Java虚拟机(JVM)之上,
2022-06-08 18:17:00 1100
原创 2.安装组件客户端程序(华为云学习笔记,HCIP,大数据)2022.6.6
实验拓扑图大数据开发机大数据数据节点大数据管理节点大数据控制节点安装组件客户端程序在FusionInsight HD中,大多数组件都提供了命令行客户端,此实验指导用户如何下载单个组件和所有组件的客户端程序,以及如何安装和卸载单个组件和所有组件的客户端程序。访问FusionInsight Manager Web UI大数据管理节点管理段IP地址是访问FusionInsight Manager Web UI的ip地址,访问链接为 http://【大数据管理节点管理段IP地址】:8080/
2022-06-08 16:31:47 440
原创 1.FI管理页面的登录及环境介绍(华为云学习笔记,HCIP,大数据)2022.6.6
实验拓扑图大数据开发机(Ubantu)大数据数据节点大数据管理节点大数据控制节点FI管理页面的登录及环境介绍此实验指导用户如何登录 FusionInsight HD 的 web 管理界面,为后续对大数据集群的管理和维护提供前导知识1.进入大数据实验平台看到此文档,说明您已经成功的登录到了大数据实验平台,此时,您应该能够看到如下图的界面,如下图所示2.打开浏览器访问FusionInsight Manager web UI点击左侧大数据开发环境标签,在大数据开发环境中双击“火狐浏览
2022-06-06 15:35:56 1005 1
原创 1.Hadoop的安装和使用(华为云学习笔记,Spark编程基础,大数据)
此笔记为第一篇,学校开放华为云平台,帮助我们学习有关大数据方面相关知识的学习笔记,因为是云平台,是已经搭建好linux环境了,使用的是Ubantu。精心整理,自学笔记,如有什么问题,请耐心指正Hadoop的安装和使用学习Hadoop的安装和使用1 安装Hadoop前的准备工作介绍安装Hadoop之前的一些准备工作,包括创建hadoop用户、安装SSH和安装Java环境等。先配置hosts,输入以下命令,将本机的hostname添加到hosts文件中:拷贝代码echo "127.0.0.1 "$H
2022-05-24 11:43:56 2585
原创 外链图片转存失败,源站可能有防盗链机制,导致图片加载不出来的问题(解决保姆级教程)如果想直接解决就把文章拉到最后+如何安装node.js+gitee仓库配置
外链图片转存失败,源站可能有防盗链机制,导致图片加载不出来的问题(解决保姆级教程)+如何安装node.js+gitee仓库配置
2022-05-22 03:37:28 1332 1
原创 2022.5.20深度学习技术学习(BETA版)TensorFlow框架中的张量与变量(后期会不断完善)
固定值张量进入[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UB9pC7eA-1653011362369)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml17484\wps1.jpg)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zrsn0PeD-1653011362370)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml
2022-05-20 09:52:08 291
原创 第四篇:(关于学习早晚和选择平台的问题------掘金和CSDN)今天又发现了有趣的点
第三天了今天在硕博交流群里面,看到了一位同志发出来的问题,想找一下C++中文版的PDF文件,然后有人提议叫他去Z-librarie去找找看,然后B站上有能访问这地方的方法,然后就发现了一位年纪轻轻的宝藏UP,首先是自己的心态问题了,人家多岁就已经在B站发解决复杂问题的视频了,我多岁还在寻求答案,居然要一个多岁的小朋友教,简直就是入了晴天霹雳一般,所以还是要先摆正自己的学习心态,虽然人家可能比自己早了多年开始学习计算机,但是只要会学习的人就不丢脸。种一棵树的最好时间是在十年前其次是在现在如果要学好相关技
2022-05-19 16:25:11 357
原创 第二篇:发现问题,写博客之前要学习一下markdown的原因
写第二篇博客时,自己发现的问题我发现,看别人学习的内容过程,如同JAVA一样,自己会看不下去,不是说别人写的不好,写的也很规范,规规矩矩,但是却不通俗易懂,这样这篇文章就失去了他对于我而言的价值,所以写博客我新发现的好处就是自己写的自己可以去看,自己舒服,自己的学习效率高,但是也有问题,就是这个就是需要联网才能写,但是我现在先试试用markdown编译器写,然后就是写完之后再直接导入...
2022-05-18 17:06:36 174
原创 第一篇:写博客前言(为什么要写博客,以及为什么要用CSDN写博客)【学生的真实感受,浅显易懂,不啰哩吧嗦】
机缘提示:可以和大家分享最初成为创作者的初心例如:实战项目中的经验分享日常学习过程中的记录通过文章进行技术交流…收获提示:在创作的过程中都有哪些收获例如:获得了多少粉丝的关注获得了多少正向的反馈,如赞、评论、阅读量等认识和哪些志同道合的领域同行…日常提示:当前创作和你的工作、学习是什么样的关系例如:创作是否已经是你生活的一部分了有限的精力下,如何平衡创作和工作学习…憧憬提示:职业规划、创作规划等Tips您发布的文章将会展示至 里程碑专区
2022-05-18 15:11:14 274
第6章 Zookeeper 2 6.1. Zookeeper入门 2 6.1.1. 概述 2 6.1.2. 特点 3 6.1.3
2022-05-21
第4章 HDFS 2 4.1. 简介 2 4.1.1. 概述 2 4.1.2. 组成架构 4 4.1.3. HDFS文件块大小
2022-05-21
第3章 Hadoop 2 3.1. 简介 2 3.1.1. 概述 2 3.2. 环境搭建 2 3.2.1. 搭建过程总览 2
2022-05-21
第2章 Linux 2 2.1. 简介 2 2.1.1. 概述 2 2.2. 环境搭建 2 2.2.1. 安装vmware 2
2022-05-21
搭建Python开发环境 在开始编程前,需要首先准备好相关工具。这里简单介绍一下如何搭建Python开发环境。 可自行在Pyth
2022-05-21
解压maven软件及maven的jar包仓库到devSoftware文件夹,并在idea设置maven插件关联 1. 2.
2022-05-21
第4章 回归与聚类算法 2 4.1. 线性回归 2 4.1.1. 线性回归的原理 2 4.1.2. 线性回归的损失和优化原理(理
2022-05-21
第3章 分类算法 3( .1. 数据集介绍与划分 3 3.1.1. 数据集的划分 3 3.1.2. sklearn数据集介绍
2022-05-21
第2章 特征工程 2 2.1. 数据集 2 2.1.1. 可用数据集 2 2.1.2. sklearn数据集 4 2.1.3.
2022-05-21
深度学习技术(tensorflow框架,张量与变量)【beta版】
2022-05-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人