自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 Idea添加依赖的步骤

Idea添加依赖的步骤:1. 项目按F4(ctrl+shift+alt+s)2. 找到dependencies选项卡3. 点击“ +”4. 将jar包选中,加入5. 可以使用jar中的工具类。网络上下载jar1. 百度搜索 maven repo2. 输入jar包的名字3. 找到对应的版本 下载jar...

2020-07-06 23:00:21 1686

原创 在pycharm运行pyspark时出现Java gateway process exited before sending its port number

参考:https://blog.csdn.net/ringsuling/article/details/84448369

2020-05-04 15:58:04 1623

原创 Spark调试

一、本地调试step1:写好程序,将master设置为local或者local[n]或者local[*]。step2:如果应到HDFS,可能会遇到winuntils找不到的问题,需要将HADOOP_HOME环境加入IDEA。方法1:下载对应hadoop-common-bin-2.7.3-x64.rar对应版本文件,解压到磁盘,在本机环境中添加。方法2:下载对应hadoop-common-b...

2020-04-25 14:13:32 451

原创 scp或ssh时提示“Host key verification failed.”

问题原因:ssh连接连接时发现ask不匹配,拒绝连接。解决办法:将/etc/ssh/ssh_config内的 StrictHostKeyChecking 值改为 no

2020-03-25 11:06:55 359

原创 Oracle基础学习之三—查询

一、 简单查询简单查询SELECT 字段[,字段] FROM 表;#例子:SELECT ename, empno FROM emp;字段和表起别名字段 as 别名;表明 别名注:别名可用双引号括起来(但因不可用,一般在表述数据值的时候使用,不在字段名、表名、关键字使用),此时所见即所得。当然不用也可以,但英文自动转换为大写。SELECT ename as name fr...

2020-03-06 09:45:44 554 1

原创 GBDT理解

参考1参考2

2020-02-29 15:27:04 555

原创 数据挖掘导论之数据

数据数据类型:描述数据需要不同的数据,数据的类型也决定了我们往往会采用何种工具和技术来分析数据。数据质量:数据质量数据分析结果的质量很关键,但数据往往存在噪声、离群点、不一致、重复、数据偏差或不能描述对象的情况。2.1数据类型2.1.1属性与度量一般而言,对象的属性的决定了所采用的的数据类型。眼球颜色具有符号数形,温度具有数值属性,进而为了更加精准的描述对象属性引入了测量标度,可以说...

2020-02-23 15:39:40 1332

原创 皮尔逊相关系数

皮尔逊相关系数衡量随机变量X与Y线性相关程度的一种方法,相关系数的取值范围是[-1,1]。相关系数的绝对值越大,则表明X与Y相关度越高。当X与Y线性相关时,相关系数取值为1(正线性相关)或-1(负线性相关)。皮尔逊相关系数公式为:与之对应的相关距离为:通常情况下通过以下取值范围判断变量的相关强度:范围程度0.8-1.0极强相关0.6-0.8强相关0....

2020-02-23 14:56:48 10968 1

转载 欧式距离、曼哈顿距离、切比雪夫距离三种距离的可视化展示

在看空间统计相关的文档资料的时候,看到了几个有关距离丈量方法的术语词汇,诸如:欧式距离、曼哈顿距离、切比雪夫距离…… 老外习惯于使用名字来命名算法,可是对于门外汉们,是一种困惑,今天就整理下,一起温故知新。1. 欧式距离(Euclidean Distance)欧式距离是我们在直角坐标系中最常用的距离量算方法,例如小时候学的“两点之间的最短距离是连接两点的直线距离。”这就是典型的欧式距离量算...

2020-02-23 09:49:22 892

原创 Oracle基础学习之二—表

一、SQL语句分类查询语句:select数据操纵语句DML:面向数据库中的数据,INSERT、UPDATE、DELETE数据定义语句DDL:面向对象的操纵,CREATE、ALTER、DROP、RENAME、TRUNCATE事务控制数据:用于撤销或提交某些操作,COMMIT、ROLLBACK、SAVEPOINT数据控制语句:用于控制数据的访问权限,GRANT,REVOKE二、数据库的...

2020-02-21 11:53:33 118

原创 ORACLE中约束的查看以及分类

https://blog.csdn.net/ok3356/article/details/81080349

2020-02-19 14:55:33 82

原创 Orcale级联删除

外键提供表内或表间的完整性规则,外键必须依赖于一个 primary 或 uniquekey。建立外键的格式:建表时:CREATE TABLE EMP(…CONSTRAINT FK_DEPTNO FOREIGN KEY (DEPTNO) REFERENCES DEPT(DEPTNO));建表后:ALTER TABLE EMP ADD CONSTRAINT FK_DEPTNO FOREI...

2020-02-19 12:26:19 149

原创 orcale一次导入多个值

insert all into JK_TB_DATE(fbmmc,fgzjh,fsbmc,fsbxh,fsbbh,db_shuifenyi,db_pihao,db_wuliaobianma) values ('检测督查科','102','水分测试仪','SDWE-BZDHX-15','hx001','1#水分仪','11','') into J...

2020-02-19 11:19:55 99

原创 代价敏感曲线理解

1.参考https://www.zhihu.com/question/634923752.理解:ROC主要考量均等代价,代价敏感曲线主要考量非均等代价。两者都是衡量某一学习器在不同场景下的综合表现情况,而不是单一场景。ROC通过阈值变化来体现不同场景,即高阈值表现了重视查准率的场景,低阈值则重视查全率的场景。代价敏感曲线则是通过P值,即正例的先验概率即原本正例占比的变化来体现不同场景。代价...

2020-02-15 12:04:50 1110

原创 几种平均数

算数平均数、调和平均数、几何平均数的计算方法与应用场合总的来说:几种平均数的应用的取决于场景一、定义1、算数平均数:又称均值,是统计学中最基本,最常用的一种平均指标,分为简单算术平均数、加权算术平均数。设一组数据为X1,X2,...,Xn,简单地算术平均数的计算公式为:加权算术平均:主要用于处理经分组整理数据。设原始数据被分成K组,各组的组中值为X1,X2,......

2020-02-15 10:15:13 15332 1

原创 P和NP问题

P vs. NP问题介绍

2020-02-14 12:32:23 62

转载 无法启动Anocoda和jupyther,无法加载或初始化请求的服务提供程序

当用命令框启动jupyther notebook时发生:无法加载或初始化请求的服务提供程序解决方法:在cmd下输入:netsh winsock reset,重启电脑,问题解决。winsock是Windows网络编程接口,winsock工作在应用层,它提供与底层传输协议无关的高层数据传输编程接口 netshwinsock reset是把它恢复到默认状态。...

2020-02-14 12:08:57 432

原创 偏度和峰度

偏度这一指标,又称偏斜系数、偏态系数,是用来帮助判断数据序列的分布规律性的指标。 在数据序列呈对称分布(正态分布)的状态下,其均值、中位数和众数重合。且在这三个数的两侧,其它所有的数据完全以对称的方式左右分布。如果数据序列的分布不对称,则均值、中位数和众数必定分处不同的位置。这时,若以均值为参照点,则要么位于均值左侧的数据较多,称之为右偏;要么位于均值右侧的数据较多,称之为左偏;除此...

2019-11-25 19:03:59 3674

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除