- 博客(35)
- 收藏
- 关注
原创 from skmisc.loess import loess DLL load failed while importing _loess: 找不到指定的模块。
卸载原有的scikit-misc包,重新安装。
2023-04-03 21:14:25
499
1
原创 R语言:方差分析,单因素方差分析,单个协变量的单因素方差分析,双因素方差分析,多元方差分析
R语言:方差分析,单因素方差分析,单个协变量的单因素方差分析,双因素方差分析,多元方差分析
2022-10-06 14:52:00
1674
1
原创 R语言数据格式转化:tidyr包里的gather、spread、separate、unit函数
R语言数据格式转化:tidyr包里的gather、spread、separate、unit函数
2022-09-29 16:46:44
1062
原创 R语言:reshape2包里的melt()、dcast()、acast()函数学习
R语言:reshape2包里的melt()、dcast()、acast()函数学习
2022-09-29 15:55:56
3517
原创 R语言:数据处理,apply、lapply、sapply、tapply函数,数据中心化标准化
R语言:数据处理,apply、lapply、sapply、tapply函数,数据中心化标准化
2022-09-27 21:37:52
842
原创 机器学习降维算法MDS、ISPOMAP
1、介绍首先先看一些定义 流形,是局部具有欧几里得空间性质的空间,能用欧氏距离来进行距离计算。 同胚,在拓扑学中,两个流形,如果可以通过弯曲、延展、剪切(只要最终完全沿着当初剪开的缝隙再重新粘贴起来)等操作把其中一个变为另一个,则认为两者是同胚的。故也可以称流形是在局部与欧式空间同胚的空间。 测地线距离,空间中两点的局域最短或最长路径如图:蓝色实线表示测地距离,蓝色虚线是传统上我们所认识的欧氏距离用流形在局部上与欧氏空间同胚这个性质,对每个点基于欧氏距离找出其近邻点,然后就能建立一个近邻
2021-11-19 16:21:37
2140
原创 解决两台节点都是standby的问题
记录一下我的解决方法是如果你启动了zookeeper但是没有这个节点,建议你重新格式化zookeeperhdfs zkfc -formatZK然后,就是有一台是active,而这一台不是你想要启动的话,在active的集群下,先关闭hdfs --daemon stop zkfc 在启动hdfs --daemon start zkfc这样另一台就是active了,前提是,你的是高可用集群...
2021-06-17 15:25:15
879
原创 hive启动初始化
hive第一次启动需要进入hive下初始化schematool -dbType derby -initSchema如果第一次初始化失败,需要进行下一次初始化需要需要在hive下删除:
2021-06-17 08:34:44
2940
原创 在两台虚拟机上同时启动namenode
除主节点master外在slave1上也启动namenode给我愁的啊~~~~~~~~先说主要部分:其实一般配置文件会出问题,但是这次我的配置文件没有问题,但就是只有master的namenode启动了,slave2namenode节点怎么也出不来但是我在启动start-dfs.sh的时候[root@master journaldata]# start-dfs.shStarting namenodes on [master slave1] // 就是这里,气死人上一次登录:三 6月 16
2021-06-16 20:57:20
1100
原创 wordcloud生成词云图全是小方框
wordcloud生成词云图全是小方框fig = plt.figure(figsize=(20,10))#创建词云对象wordcloud = WordCloud(background_color='white',scale=2,collocations=False,random_state=30)#生成词云wordcloud.generate(describe_document)plt.imshow(wordcloud)用此命令生成词云图全是小方框这是因为新下载好的wordcloud里没
2021-04-19 15:03:40
9703
1
原创 MySQL的下载安装教程(zip格式免安装)
MySQL的下载安装教程查看环境下载安装配置环境环境变量新建文件启动服务远程访问工具连接查看环境先看是否满足可以下载MySQL的环境方法一:Windows+R cmd进入操作页面,输入netstat -ano查看3306号端口是否被占用,无,可下载方法二:右击此电脑,点击管理查看是否已经有MySQL进程,没有再下载下载到MySQL官方网站下载https://www.mysql.com/在页面最下边安装由于我们下载的是zip格式,(不是msi)所以相对来说简单点,不用安
2021-04-02 22:13:08
177
原创 HA:高可用集群搭建
HA高可用集群搭建需要知道的是部署集群节点至少需要三台虚拟机,这里我命名为node01,node02,node03,另外需要自己准备好各种安装包,一下是需要准备的安装包和本人使用的版本信息:ISO映像文件 :CentOS-7-x86_64-Minimal-1804.isojdk:jdk-8u231-linux-x64.tar.gzHadoop:hadoop-3.1.4.tar.gzzookeeper:apache-zookeeper-3.6.2-bin.tar.gz部署集群节点我们接下来需要部
2021-04-01 17:08:47
297
原创 VMware密匙安装教程
Vmware的安装安装条件:64位操作系统自己已经下载好VMware的安装包,本人下载的是VMware 15版本直接开始安装安装后启动的关键是,如果想长时间的使用VMware需要有密匙 CG392-4PX5J-H816Z-HYZNG-PQRG2,输入密匙便可顺利打开VMware界面使用VMware需要电脑支持开启虚拟化设置可以先查看一下自己电脑的虚拟化是否已经启动打开任务管理器,选择“性能”查看虚拟化是否开启本人的是已经默认开启的,日过你的电脑虚拟化还未开启,可以在
2021-03-14 22:23:34
5024
6
原创 JDK的简单下载安装与配置
JDK的简单下载安装与配置下载安装配置检验下载在官网下载需要注册orale账号,如果你不想注册,可以试试以下方法,本人亲测!在西西软件园,搜索jdk点击第一个进入本人选择河北联通下载,其实无所谓下载完成安装点击文件夹进入双击安装jdk,一直点击下一步,如果你更改了jdk的安装位置,后面添加配置位置要注意路径配置右击“此电脑"选择属性在系统变量里,点击新建将复制的路径添加到变量值内,变量名为JAVA_HOME之后确认找到path检验电脑左下角右击点击“运
2021-02-05 20:45:12
96
原创 hadoop+Springboot+Echarts网站访问量数据分析及可视化
网站访问量静态日志文件分析系统目录大纲获取静态日志数据预处理新建Maven打包jar包运行数据仓库开发下载安装hive修改配置文件配置MySQL元数据库实现数据仓库数据分析流量分析人均浏览量分析sqoop数据导出安装Sqoop并配置将数据导入MySQL日志分析系统报表展示创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入目录大纲获取静态日志找到
2021-01-16 01:28:34
2765
4
原创 Hadoop:关于“name node is in safe mode”命令hdfs dfsadmin -safemode无法退出的问题
本内容不涉及过多的原理,想了解原理的可以搜索其他博文知道你很急,结果先供上:这种一般情况(网上一搜一大片的)用hdfs dfsadmin -safemode leave:退出当前的安全模式(这种方法我也是在网上看到的)但是,我写这个文章怎么会是一般情况,二般情况(也是我的情况):如果你用上面那个输入后安全模式还是显示ON,那就试试命令:hdfs dfsadmin -safemode forceExit二级标题不过我在用这个命令前看到说,用这个强制命令会使数据丢失,但是我用了之后也没发现
2020-12-25 18:54:15
367
原创 selenium笔记:从安装到爬取去哪儿上海当日酒店
selenium笔记:从安装到爬取去哪儿上海当日酒店本人刚刚接触Selenium,觉得还挺好玩的,据本人了解,Selenium是一个自动化监测工具,一般我们会使用Firefox、Chrome来进行浏览器的驱动,它可以对页面进行控制,对页面进行多种操作,也可以获得浏览器当前页面的源代码,实现对指定内容的爬取。话不多说,内容呈上!一、Selenium的安装1. 两种安装方法命令行安装,打开cmd,直接输入命令pip install selenium到https://pypi.org/project/
2020-10-12 00:29:59
326
3
原创 pycharm下anaconda环境的搭建
pycharm下anaconda环境的搭建接触过python的你是用什么编辑器来写python的呢?一般情况下,由于我们在编写程序的时候需要用到大量的包来便于某些操作,所以我们会下载anaconda这样的“大件儿”来编写。确实,anaconda很便利,很多需要使用的包它都有,其下的Spyder和Jupyder都是不错的编辑器,但是 ~,总有些人的爱好不太一样,譬如沐一我,喜欢用pycharm这样的编辑器来编写程序。既想用pycharm来编写又想用anaconda的编辑环境怎么办呢???,今天沐一我就来讲
2020-09-19 16:29:16
216
原创 Python :文本数据挖掘并绘制词云图
Python :文本数据挖掘并绘制词云图前言材料准备导包对文章预处理分词去停用词词频统计制作词云图结果展示及主函数前言绘制词云图的目的是方便快捷有效的掌握一篇文中的中心概要或了解大致方向与内容。本文我将以《摆渡人》这本书为例,进行对文本中文字的统计,并绘制词云图。另: 本人采用python编写,本文中我是用的是pycharm进行的编译过程,配置的Anaconda环境。因为本文中涉及很多的包,单独下载过于麻烦,所以建议下载anaconda,使用anaconda中的Spyder或者Jupyter均可,使
2020-09-16 19:21:04
3021
1
原创 R语言:生成均匀分布的随机整数添加变量名称并绘制条形图
R语言:生成均匀分布的随机整数添加变量名称并绘制条形图本篇中主要使用的函数:runif() :用来随机生成服从均匀分布的整数names() :定义变量名称或对变量名称进行修改paste() :用于字符串的连接,并用sep属性控制间隔barplot() :用于绘制柱状图,其内包含多个属性用于完善图表过程概要函数介绍完了,接下来,我将以生成5个500到10000之间服从均匀分布的随机整数为例,进行后续操作,一起来看看吧!全新的界面设计 ,将会带来全新的写作体验;在创作中心设置你.
2020-09-16 14:48:40
9066
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人