自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一只大数据专业的傻猪猪

初来驾到,努力奋斗!

  • 博客(36)
  • 资源 (8)
  • 收藏
  • 关注

原创 去哪儿旅游网站采集程序的设计与实现

相关课程与技术:《数据采集与网络爬虫技术》、requests、BeautifulSoup、pymongo等等。这是我一年前的项目了,今天决定总结出来分享给大家!一起学习啊。目录一、项目的目的与意义二、采集目标确定三、去哪儿旅游网站分析四、数据采集流程与步骤说明五、数据采集实现过程(1)进入搜索广州门票首页核心代码展示:(2)景点详细页面信息获取核心代码展示:(3)景点评论评分页面信息获取核心代码设计展示:六、数据采集结果说明七、项目总...

2022-04-30 16:34:44 2171 4

原创 【Spark实训】--竞赛网站访问日志分析

竞赛网站访问日志分析;1、过滤出访问次数在 50 次以上的用户记录 2、统计访问 50 次以上的用户主要访问的前 5 类网页 3. 合并部分网页 4.根据访问时间加入对应时段

2022-04-17 16:29:10 6894 1

原创 【JavaScript实训】-- 制作年历

获取指定年份1月1日的星期数值;拼接每个月份的表格;获取月份m共有多少天;

2022-05-24 02:30:00 3696 3

原创 Spark Streaming : 实时计算框架 ㈠

一、流式计算处理模式:1. spark streaming介绍;2. 数据流程;3. 计算思想;Spark Streaming 数据抽象 DStream二、案例实现:案例1:连接到node2 8888端口,接收实时数据做分析。设置日志级别;从SparkConf创建StreamingContext并指定5s的批处理大小;启动连接到node2 8888端口上,使用收到的数据创建DStream;启动流计算环境StreamingContext。

2022-05-22 18:35:45 1805

原创 【JavaScript实训】-- 限时秒杀

限时秒杀:1、设置秒杀结束时间2、声明变量保存剩余的时间3、设置定时器,实现限时秒杀效果4、获取时间差,单位秒5、判断秒杀是否过期6、取消定时器7、将剩余的天、小时、分钟和秒显示到指定的网页中

2022-05-22 16:07:44 7348

原创 【Spark实训】-- Spark SQL结构化数据文件处理 ②

题目:统计分析航空公司客户数据的空值以及异常值。1.统计观测窗口的票价收入(SUM_YR_1)、观测窗口的总飞行公里数(SEG_KM_SUM)和平均折扣率(AVG_DISCOUNT)三个字段的空值记录,并将结果保存到名为null_count的表中。2. 统计air_data_table表中观测窗口的SUM_YR_1(票价收入)、SEG_KM_SUM(总飞行公里数)和AVG_DISCOUNT(平均折扣率)三列的最小值min_count表中。

2022-05-19 14:16:55 1640

原创 【Spark实训】-- Spark SQL结构化数据文件处理①

(1)统计非重复的用户个数(2)统计用户听过的歌曲总数(3)找出ID为“1000002”的用户最喜欢的10首歌(即播放次数最多的10首歌曲)

2022-04-21 21:14:21 5436

原创 【NoSQL数据库技术与应用】-- MongoDB数据库操作

目录一、利用文件启动mongodb:二、windows的cmd连接mongodb:三、使用python操作mongodb:1、连接数据库2、查看数据库3、查看集合4、删除集合5、查看文档6、插入(增加)文档7、更改文档8、删除文档一、利用文件启动mongodb:1.进入mongodb文件cd /opt/servers/mongodb_demo/mongodb2.创建一个新文件夹mkdir conf3.进入文件夹cd conf4.编辑这个文件..

2022-04-10 21:42:55 2340

原创 【bug解决】Python运行显示报错--没有为项目配置Python解释器

设置解析器,Python运行显示报错没有为项目配置Python解释器No Python interpreter configured for the project

2022-04-10 18:12:42 11517

原创 【中断循环】-- break和continue语句

作用:都是用来控制循环结构的,主要是停止循环。目录break语句:continue语句:continue语句和break语句的区别是:扩展资料:break语句: 可以用在循环语句和switch语句中。在循环语句中用来结束内部循环;在switch语句中用来跳出switch语句,其作用是终止当前语句的执行,选择结构或循环语句,执行后面的代码。continue语句: 用于结束本次循环的执行,开始下一轮循环的执行操作。continue关键字用于立即跳出本次...

2022-04-10 17:23:27 3109

原创 【Spark编程进阶】-- 基于IDEA应用开发实现文档单词计数

Spark编程进阶基于IDEA应用开发实现文档单词计数

2022-04-08 23:17:35 2191

原创 [JavaScript实训] -- 制作简易的购物车页面

JavaScript实现制作简易的购物车页面

2022-04-05 23:15:49 12376 2

原创 [bug解决] IDEA spark编译出现error:object Apache is not a member of package org

error:object Apache is not a member of package org

2022-04-05 14:59:20 7826 1

原创 【HTML的基本标记】-- 块级元素与内联元素的使用

1、块级(block)元素,2、内联(inline)元素、

2022-04-04 02:00:00 1623

原创 【云计算】私有云在VMware下虚拟机的创建与配置(图文教程)

【云计算】私有云在VMware下虚拟机的创建与配置(图文教程)

2022-04-02 11:23:12 4430 1

原创 【Hadoop实训】统计文件中所有单词的平均长度

统计文件中所有单词的平均长度

2022-04-01 22:02:30 2038

原创 【spark实训】-- Scala实现单词计数

spark--Scala实现单词计数

2022-04-01 21:40:33 8689 4

原创 网站开发基础知识

一、认识网页二、网站设计的基本概念1、基本概念2、网站3、静态网页和动态网页3.1、静态网页3.2、动态网页三、互联网的访问过程与工作机制1、访问过程浏览器与服务器WWW与万维网IP地址和域名URL和HTTP协议2、工作机制四、制作网站的标准和常用技术五、常用的开发工具

2022-03-30 16:28:20 1563

原创 Java数据采集实训--网页数据结构的分析

大数据项目实战的数据采集中的分析网页数据结构详情。

2022-03-28 06:00:00 1005

原创 【JavaScript实训】-- 编写一个带两个变量和一个运算符的四则运算函数

html+JavaScript实现编写一个带两个变量和一个运算符的四则运算函数

2022-03-27 22:00:00 4019

原创 【JavaScript实训】-- 打印倒正金字塔直线

使用JavaScript输出倒正金字塔直线。

2022-03-27 01:00:00 5313

原创 【JavaScript实训】调试程序--根据时间问好

一、题目要求:(1)、当输入当前时间值为6~12时,页面显示“上午好!欢迎来到一只傻猪猪的博客”,输入几点显示几个图标。如图1-1所示:(2)、当输入当前时间值为13~20时,页面显示“中午好!欢迎来到一只傻猪猪的博客”,输入几点显示几个图标。如图1-2所示:(3)、当输入其他时间值时,页面显示“夜深了,该休息啦!”,输入几点显示几个图标。

2022-03-26 15:39:13 1917

原创 PHP实现简单计算器

目录一、题目:二、基本界面设计代码:三、分析:四、实现编程三个步骤五、完整实现代码一、题目: 题目描述:下列列表框中有+、-、*、/四种运算符,选择不同的运算符进行,单击计算按钮进行不同的计算。二、基本界面设计代码:<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>简单计算器</...

2022-03-25 12:27:10 12077 1

原创 spark实训题 -- Scala基础编程【1】

目录实训目的实训1:编写函数过滤文本中的回文单词1. 训练要点2.需求说明3.思路及步骤实训2:使用Scala编程输出杨辉三角1. 训练要点2.需求说明3.思路及步骤实训3:用Scala编程求出100~999之间的所有水仙花数。实训目的( 1)掌握Scala的REPL使用。(2)掌握Scala的Array、List、Map等创建与使用。(3)掌握Scala循环与判断的使用。( 4)掌握Scala函数式编程。实训1:编写函数过滤文本中的回文单..

2022-03-24 02:30:00 9106 1

原创 【Spark编程】-- 统计文本中性别为“男”的用户数

题目:统计文本中性别为“男”的用户数。1.训练要点(1)创建RDD的方法。(2) map转换方法。(3 ) filter的用法。(4) count的用法。2.需求说明 文档test.txt需要自己下载,一个用户 的信息存储为一行数据,现在要求过滤出其中性别为“男”的用户,并且统计有多少行符合要求。3.实现思路及步骤:全部代码展示:hdfs dfs -put test.txt /user/rootval testdata=sc.textFile("h...

2022-03-22 10:50:22 5009

原创 samba的安装配置

1、共享目录/samba/b1,任何人只读访问;2、共享目录/samba/b2,仅用户bys和组gd成员可以访问,仅bys有可写的权限;3、共享目录/samba/b3,任何人可以读写,但不同的用户只能访问创建的文件夹

2022-03-21 03:00:00 598

原创 进阶版--Mongodb命令汇总

目录一、基本命令:二、常用命令:1、基本查询:2、按照条件查询3、按特定类型查询4、统计查询5、分页查询6、聚合管道操作7、分组8、索引9、设置权限用户的步骤--简单10、设置权限用户的步骤--复杂一、基本命令:查看当前数据库:db 创建并进入数据库:use jxx 查看所有数据库:show dbs(空库不显示) 删除当前数据库,需要先进入当前数据库:db.dropDatabase() 创建集合(集合与表的区别:集合无序、不可重...

2022-03-20 16:47:57 1303

原创 Mongodb的使用说明 -- 适合初学者篇【1】

什么是Mongodb?Mongodb数据类型、Mongodb的使用规范,数据库使用规范、集合使用规、文档使用规范, Mongodb的安装部署MongoDB 部署,下载与安装Mongodb的启动与使用

2022-03-20 15:03:15 4197

原创 解决报错显示:【客户端:IPC客户端(1783083399)到主机的连接/192.168.73.130:8088从根目录:已停止,剩余连接0】

22/03/18 11:34:00 DEBUG ipc.Client: IPC Client (1783083399) connection to master/192.168.73.130:8088 from root: stopped, remaining connections 0java.io.IOException: Failed on local exception: com.google.protobuf.InvalidProtocolBufferException: Protocol me

2022-03-19 02:00:00 3027 1

原创 Linux--网络服务器配置步骤详情【2】

六、配置安装DNS服务器七、Web服务器1、Apache服务器的安装与测试2、个人网站的配置安装3、配置基于端口号的虚拟主机4、配置基于域名的虚拟主机

2022-03-18 20:00:00 369

原创 解决报错显示:log4j:WARN No appenders could be found for logger .

log4j:WARN No appenders could be found for logger (org.apache.http.client.protocol.RequestAddCookies). log4j:WARN Please initialize the log4j system properly. log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.

2022-03-18 16:04:03 26097 1

原创 cmd启动mongo显示控件[main]全局初始化失败:FileNotOpen:无法打开“D:\mongodb\data\logs\mongo.log”

cmd启动mongo报错2022-03-14T08:45:33.174+0800 F CONTROL [main] Failed global initialization: FileNotOpen: Failed to open "D:\mongodb\data\logs\mongo.log"

2022-03-15 09:48:04 4182 2

原创 Linux--网络服务器配置步骤详情【1】

一、配置ip地址二、配置yum服务器三、配置安装nfs服务器四、安装配置samba服务器五、安装配置DHCP

2022-03-14 06:00:00 2094

原创 Linux -- NFS的安装与配置

一、题目:共享/nfs/media, 使172.16.42.0/24下的所有人只读,root用户映射为匿名用户。 共享/nfs/doc,使j2.fangtuan.com这台主机可以读写,其它用户只读,且root映射为匿名用户。 共享/nfs/soft,所有人只读访问,访问者(包括root)映射成用户nfsuser,组nfsuser NFS测试画面目录一、题目:二、准备阶段:yum安装,配置yum修改如下内容:安装三、题目解析:四、配置:五、NFS测试画面...

2022-03-13 15:50:29 1842

原创 spark 在本地模式提交spark-submit报错Name node is in safe mode

问题描述运行过程中报错显示:原因分析:根据报错显示,可以发现报错内容显示的是:名称节点处于安全模式。安全模式下不可以实现增删改操作。 当块的数量低于阀值,datanode启动数量不够都会进入安全模式。安全模式主要是为了系统启动的时候检查各个DataNode上数据块的有效性,同时根据策略必要的复制或者删除部分数据块。运行期通过命令也可以进入 安全模式。解决方案:hadoop为了防止数据丢失,启动了“安全模式”的设置,我们只需要关闭安全模式即可。...

2022-03-11 11:13:18 1949

原创 visual Studio Code编写出现PHP文件乱码

1、查看当前编码类型若不是则改为utf-82、在代码中加入如下代码<?phpheader("content-type:text/html;charset=utf-8"); //设置编码格式?>测试如下:3、若是与HTML文件一起写的则在<head> 代码段 </head>内加入:<meta charset="UTF-8">...

2022-03-08 15:30:04 1186

大数据项目实战—招聘网站大数据职位分析

大数据专业必学的课本《大数据项目实战》里面的实战项目,完整的源代码包,下载后可能要改一下ip地址,自己修改一下,就能用了。

2022-05-20

jc_content_viewlog.txt

个人主页博文所需要的文件:【Spark实训】--竞赛网站访问日志分析,博文链接:https://blog.csdn.net/weixin_58330979/article/details/124229174?spm=1001.2014.3001.5501

2022-04-17

实训题实现页面所需的图片资源

我博客里面写到的实训题示例所需要的图片总结。不断更新中。

2022-04-05

log4j.properties 文件

在Eclipse里编写Java程序语言运行时所需文件。

2022-03-18

LINUX期末考试试卷.doc

一、NFS的安装与配置 共享/nfs/a1, 使192.168.28.0/24下的所有人只读,root用户映射为匿名用户。 共享/nfs/a2,使a1.bys.cn这台主机可以读写,其它用户只读,且root映射为匿名用户。 共享/nfs/a3,所有人只读访问,访问者(包括root)映射成用户nfsuser,组nfsuser 二、SAMBA的安装与配置 共享目录/samba/b1,任何人只读访问; 共享目录/samba/b2,仅用户bys和组gd成员可以访问,仅bys有可写的权限; 共享目录/samba/b3,任何人可以读写,但不同的用户只能访问创建的文件夹。 三、DHCP的使用

2022-03-13

SecureCRT远程连接工具安装包

SecureCRT远程连接工具安装包

2022-03-02

mongodb安装包及安装步骤(windows)

1、mongodb的安装包 2、安装步骤视频说明 3、安装所需文件及测试

2022-03-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除