自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

翻译 ChromeDriver谷歌驱动最新版安装118/119/120

ChromeDriver谷歌驱动最新版安装118/119/120需要最新版的谷歌驱动安装。但他里面最新也就才114,所以进行其他方法搜索。

2023-10-24 14:08:43 45098 30

转载 pip install时ReadTimeoutError报错

在pip install holidays后面加一个-i参数,然后在后面加上国内的镜像源,使用国内的镜像源,进行安装。清华大学: https://pypi.tuna.tsinghua.edu.cn/simple/清华源: https://pypi.tuna.tsinghua.edu.cn/simple/阿里云: http://mirrors.aliyun.com/pypi/simple/使用这种方式安装某些库的时候,会从国外的镜像源去下载,最终导致反应超时的情况发生。最终结果,快速安装成功!

2023-04-16 15:55:25 326

转载 PyCharm安装教程最新版(社区版)

2023年PyCharm的社区版本安装详细步骤

2023-02-27 10:37:06 18789

转载 eclipse安装教程(2023年2月)

本人大数据专业,目前初学后端,也是初次安装,自己一步一步下载的过程。首先,单击到在此页面向下滑动,可以看到第二个版本(比较适合我们初学者),结合自己电脑版本,选择右边对应版本进行点击。上述操作后,选择,可以展开服务器列表。我们可以选择一个最近的服务器地址下载,一般选择大连东软信息学院。要是选择国外的服务器,会无法访问或下载速度很慢。然后等待下载完解压即可。在进行下一步操作之前,需要提前查看自己的电脑配置里是否有jdk和jre。

2023-02-20 19:37:52 3522 1

原创 js里的$ is not define

检查的时候他这却报错了,$ is not define。jQuery它本身是一个js文件,所以我们需要每次加载它到我们的html页面,之后就可以直接使用了。2.大部分插件都是依赖于jquery而存在的,我说大部分并不夸张。哪怕说所有都不为过。所以在引入js文件的时候,你要注意引入的顺序。课上操作Web前端写js部分时,内容没有什么问题,但是检查的时候他这却报错了,$ is not define。在检查过程中发现我在引js文件时这个顺序怪怪的,然后就试了试换一下顺序,就好了。

2022-11-02 18:36:56 2169

原创 python里的TypeError: unhashable type: ‘list‘解决方法

当我们的数据取两列作为key时,它的key的类型就会变为列表。这时候如果要进行针对于可以的操作,就会出现上方所说的“TypeError: unhashable type: 'list'”,查看了一些其他资料后发现Python不支持dict的key为list或set或dict类型,因为list和dict类型是unhashable(不可哈希)的。

2022-11-02 18:20:04 5707

原创 windonws下spark的安装(最新安装)

spark超详细安装步骤(1) 针对于不可写问题,只要它下面已经说明已经安装或安装成功便可忽略;(2) 对于没有“py4j”库的问题,通过pip install py4j==0.10.9.5 即可添加。

2022-10-30 13:25:14 5794 5

原创 Anaconda官网无法下载WIndows对应exe

​最近电脑重装系统后,我在下载anaconda时,点击Download就一直跳转到注册页,找了好多方法是试了试,终于找到了我想要的解决方法:方法一:进到Anaconda官网后,在下图的Download上右键!!!【在新标签页打开链接】,它就会开始下载。注:不要像平时一样,左键Download进入,不然又进入了注册页,和循环似的。​

2022-10-29 09:33:52 850 3

原创 Hive数据分析案例——汽车销售数据分析

HiveQL汽车销售数据分析,一些简单问题求解

2022-05-23 17:32:49 6545 6

原创 Hive建外表操作以及其它修改表操作 hive外表与内表区别

hive创建外表,分区的删除、查看操作,一些插入,重命名和删除操作数据类型map和struct的创建表操作

2022-05-09 19:38:17 3845

原创 Hive工作原理和简单查询、筛选数据操作

hive是基于Hadoop的一个数据仓库工具,提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。一些简单查询、筛选数据操作

2022-05-09 10:31:46 1031

原创 第三章 HBase Shell操作

关于HBase的表操作和数据操作

2022-04-03 11:26:44 2573

原创 第3章 Hadoop---hdfs dfs常用命令的使用

HDFS shell常用文件操作命令汇总hdfs dfs文件操作命令

2022-03-28 11:17:38 4690

原创 第三章Hbase数据模型

Hbase基本概念和数据模型

2022-03-28 10:03:03 3635

原创 进一步走近HDFS

1.定义HDFS是Hadoop Distribute File System的缩写,它是Google公司的GFS分布式文件系统的开源实现,是Apache Hadoop项目的一个子项目。支持海量数据的存储,成百上千的计算机组成存储集群,HDFS可以运行在低成本的硬件之上,具有的高容错、高可靠性、高可扩展性、高吞吐率等特征,非常适合大规模数据集上的应用。1.1优点数据冗余 ,高容错性 数据自动保存多个副本 副本丢失后,自动恢复 可构建在廉价机器上 流式文件访问 一次性写入,多次读取 保证数据一致性

2022-03-17 19:04:17 2447

原创 Hbase简介

Hbase基本原理,数据节点、名称节点

2022-03-08 20:01:04 5588 1

原创 初始Hadoop技术

Hadoop,分布式数据结构

2022-03-07 14:32:57 1985

原创 传统数据库基础简介+轻松理解

关系型数据库详解

2022-03-06 21:28:50 1305

股票收盘价走势预测与绘制

现有数据‘GOOG.xlsx’。数据文件包含7列,分别代表着【股票代码、日期、收盘指数、最高指数、最低指数、开盘指数、数量】。该数据文件只包含了GOOG单只股票从2016-06-14至2021-06-11的数据。 要求以后100天之前的数据作为训练数据,后100天的数据作为测试数据,使用机器学习中的回归算法对【收盘指数】进行预测(需要考虑使用哪一种回归算法)。随后对得到的预测值与真实值进行对比,并使用python中的绘图方法将预测值与真实值的折线图进行绘制。要求使用两种颜色绘制折线,设置横坐标的节点为25个日期点(但绘制的是100天的数据),并相应添加图像的标题、横纵坐标名、图例。 逻辑: ①读取数据 → ②将数据切分为训练集和测试集的x,y → ③用机器学习库中回归算法模块进行训练与预测得到预测值的y → ④提取后100天数据的日期于一个列表中 → ⑤设置两个空列表x1与x2 → ⑥x1存放1-100的数字,x2存放每隔4个一次的1-100的数字 → ⑦绘制图像(前面步骤提到的日期列表、x1、x2都会用到)

2023-06-28

数据分析与挖掘之实验 PCA主成分提取

现有数据‘Country-data.xlsx’。数据文件包含10列,其中第1列为【国家名称】,其余九列我们暂不考虑其具体含义,仅将其视为数据标签列X1~X9,其中数据均为数字类型。现要求提取该数据集X1~X9的主成分,并设置其累计贡献率达90%,并输出其特征向量和贡献率属性。 现有数据‘Country-data.xlsx’。数据文件包含10列,其中第1列为【国家名称】,其余九列我们暂不考虑其具体含义,仅将其视为数据标签列X1~X9,其中数据均为数字类型。现要求提取该数据集X1~X9的主成分,并设置其累计贡献率达90%,并输出其特征向量和贡献率属性。

2023-06-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除