jshazhang的专栏

自我积累

java虚拟机笔记-虚拟机性能监控与故障处理工具

2019-03-21 14:35:07

阅读数 33

评论数 0

决策树基本概念

信息量 I=log⁡2mI=\log_2mI=log2​m 如果两队比赛,只有两个结果,m=2。I=1,信息量为1 世界杯32支队伍,冠军的信息量I=log⁡232=5I=\log_232=5I=log2​32=5 上面公式有个前提,就是m情况产生的概率均等 事件出现的概率越小,信息量越大。信息量...

2019-03-20 18:53:20

阅读数 28

评论数 0

hadoop3.1.1集群安装问题

这里不讲步骤,只讲遇到问题 首先配置几个-site.xml hadoop3端口号默认的改了 Namenode 端口: 50470 --> 9871 50070 --> 9870 8020 --> 9820 Secondary NN ...

2018-11-27 13:55:01

阅读数 281

评论数 0

java虚拟机笔记-垃圾收集器与内存分配策略

2018-11-20 14:18:55

阅读数 34

评论数 0

java虚拟机笔记-java内存区域与内存溢出异常

2018-10-27 08:40:42

阅读数 45

评论数 0

SVM

点到目标函数距离 如图 y=w⋅x+b=0y=w \cdot x +b =0y=w⋅x+b=0 y1=w⋅x1+b=1y_1=w \cdot x_1 +b =1y1​=w⋅x1​+b=1 ① y2=w⋅x2+b=−1y_2=w \cdot x_2 +b =-1y2​=w⋅x2​+b=−1②...

2018-09-25 19:14:10

阅读数 58

评论数 0

solr大批量数据导出

需求 有100个core,每个core4000w数据量。把所有数据导出来。 方案1. 直接对每个core通过HttpSolrClient先取出总条数,然后通过每次分页读n行,直到读完,这个方案肯定不行,因为越到后面,读取速度越慢,不用想都要很长时间。 方案2. 深度分页 通过游标,可以使分页速度很...

2018-09-20 14:21:51

阅读数 1530

评论数 3

多元函数的极值

多元函数的极值 定义 z=f(x,y) (x,y)∈∈\inD,M0(x0,y0)∈D(M0是D的内点),U(M0,δ(域))⊂DM0(x0,y0)∈D(M0是D的内点),U(M0,δ(域))⊂DM_0(x_0,y_0)\in D(M_0是D的内点) ,U(M_0,\delta(域))\s...

2018-08-18 09:59:26

阅读数 6569

评论数 1

BP推导

图 符号 aniaina_i^n 推导 向前传播 第一层 a(1)1=x1ja1(1)=x1ja_{1}^{(1)}=x_{1j} a(1)2=x2ja2(1)=x2ja_{2}^{(1)}=x_{2j} 第二层 z(2)1=a(1)1w(1)1+a(1)2w(1)3+b1=x1...

2018-07-12 19:14:19

阅读数 74

评论数 0

mapreduce运行遇到的问题-1

1.ShuffleError: error in shuffle in fetcher Error: org.apache.hadoop.mapreduce.task.reduce.Shuffle$ShuffleError: error in shuffle in fetcher#1 at ...

2018-07-05 20:06:44

阅读数 418

评论数 0

solr入数据报async exception during distributed update bad request错误

因为入库时候增加了索引,schema没有更新增加索引表。导致不一致

2018-06-28 09:39:54

阅读数 286

评论数 0

logistic回归公式推导

假设函数 h(θ)=11+e−θTXh(θ)=11+e−θTXh(\theta)={1\over{1+e^{-\theta^TX}}} 为什么使用sigmod 代价函数 J(θ)=−1m∑i=1m[yilog(hθ(xi))+(1−yi)log(1−hθ(xi))]J(θ)=−1m∑i=1...

2018-06-05 21:03:33

阅读数 211

评论数 0

线性回归损失函数推导-最大似然

把统计看了一遍就是为了这里! 线性回归假设函数为 y=θTXy=θTXy=\theta^TX 之前是根据函数图像推导出损失函数为误差平方和,这次用统计学方法推导。 拟合数据,就是把误差减到最小 误差ϵ=y−θTXϵ=y−θTX\epsilon=y-\theta^TX。 假设误差服从正态...

2018-05-28 20:01:18

阅读数 798

评论数 0

统计-参数估计

参数估计 在数理统计中,我们见到的总体X一般都是未知的。 即便根据以往的经验和数据,知道X服从哪类分布,,其数字特征(数学期望,方差,矩)也是未知的。 这些未知的数字特征以及含在总体X中的未知数称为未知参数未知参数\color{red}{未知参数}简称参数 为了估计未知参数的真值或其所在区...

2018-05-28 14:57:57

阅读数 335

评论数 0

多元线性回归正规方程java代码

正规方程:A=(XXT)−1XTYA=(XXT)−1XTYA=(XX^T)^{-1}X^TY 之前已经证明过了。 用JAMA包做矩阵计算 结果自己造的数据矩阵不可逆。。。。。 package com.zy.ml; import java.io.File; import java.io.IO...

2018-05-23 16:42:55

阅读数 737

评论数 4

多元线性回归批量梯度下降java代码

多元假 设函数 hθ(x)=θTX=θ0x0+θ1x1+...+θnxn,x0=1hθ(x)=θTX=θ0x0+θ1x1+...+θnxn,x0=1h_{\theta}(x)=\theta^TX=\theta_0x_0+\theta_1x_1+...+\theta_nx_n , x_0=1...

2018-05-22 18:54:54

阅读数 373

评论数 0

统计-样本及抽样分布

第六章 样本及抽样分布 在概率中,我们所研究的随机变量的分布都是假设已知的。 在数理统计中,我们研究的随机变量的分布是未知的,或者是不完全知道的。我们通过对随机变量进行大量重复、独立的观察,收集书记,然后对数据进行整理,分析,从而对所研究的随机变量的分布作出各种推断。 随机样本 总...

2018-04-21 19:22:14

阅读数 217

评论数 3

md图片测试

![avatar](data:image/jpg;base64, /9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8UHRofHh0a HBwgJC4nICIsIxwcKDcpLDAxNDQ0Hyc5PTgyPC...

2018-04-14 10:12:42

阅读数 838

评论数 0

统计-大数定律及中心极限定理

大数定律及中心极限定理

2018-03-28 18:49:24

阅读数 580

评论数 0

统计-随机变量的数字特征

第四章 随机变量的数字特征 数学期望 例子 成绩 0分 1分 2分 3分 4分 5分 人数 2 5 8 15 12 8 频率 2/50 5/50 8/50 15/50 12/50 8/...

2018-03-25 16:24:33

阅读数 200

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭