- 博客(65)
- 问答 (1)
- 收藏
- 关注
原创 Java实现Fisher‘s Exact Test 的置信区间的计算
这段算法是从一个网站(https://www.easycalculation.com/statistics/odds-ratio.php)源码中发现,仅仅是php转换成了java。
2023-10-24 21:34:00 560
原创 ETL VS ELT
ETL是 extract、 transform 和 load三个单词的缩写,它代表一种数据集成过程,属于方法学;它将来自多个数据源的数据组合成一个单一的、一致的数据存储,并将其加载到数据仓库或其他目标系统中。ETL为数据分析和机器学习提供了基础。通过一系列业务规则,ETL以满足特定业务需求的方式清理和组织数据,比如月度报告,另外它还可以处理更高级的分析,这可以改善后续流程或用户体验。ETL的工作流程一般包含以下三个步骤提取数据清洗数据导入数据。
2022-10-27 10:44:01 1160
原创 【随想】主板上的信息流通
从硬件上讲,CPU和主板上其他设备的通信分为两种:一种是和内存的通信;另一种是和内存以外的设备通信。CPU和内存的通信依靠三大总线:控制总线、数据总线和地址总线:通过地址总线发送需要操作的内存地址通过控制总线发送控制信号(读或者写)通过数据总线传输数据。地址总线一次发送一个地址,对应一个字节的地址(按字节编址);控制总线可以通知内存是只传输当前这个字节的地址,还是这个地址相邻的后续几个字节;如果数据总线有64根,那内存就可以一次最多返回8个字节。CPU和内存以外的设备通信也要依靠
2022-05-25 16:33:24 576
原创 java实现重复测量T检验
术语及定义1、重复测量定义在重复测量研究中,样本中的个体要在同一个因变量下被测量多于一次,所有的处理条件都使用相同的被试。2、与独立试验研究的区别重复试验与独立试验的区别是,重复试验使用的是同一批样本,比较的是同一个样本在施加因变量影响后与处理前的变化。示例及公式表1 放松训练前后,在哮喘发作时,病人所需药物的剂量病人训练前的一周训练后的一周DD^2A93-636B41-39C50-525D43-11E72
2022-05-08 15:03:03 1143
原创 flush方法何时有效何时无效
在一个下载需求中,为了优化用户体验,在服务端的数据处理前加入了以下代码:response.getOutputStream().flush().....查询数据.......flush方法会把响应头立即发送到客户端。虽然以前就知道flush的作用,但毕竟没看过它的源码,突然想到一个测试:@RequestMapping("hello")@ResponseBodypublic String hello(HttpServletRequest request,HttpServletResponse r
2022-02-17 20:05:16 1797
原创 web开发中关于http报文解析的细节
以下网站是对http报文如何解析的详细解释,是一种协议约定,服务器需要按这个约定实现:https://httpwg.org/specs/rfc7230.html#rfc.section.3.3.3其中以下内容是关于服务器应该如何解析报文正体的,不论请求类型是参数还是文件:…If a Transfer-Encoding header field is present in a response and the chunked transfer coding is not the final encod
2022-01-15 12:24:30 998
原创 关于泊松分布在测序原理中的解释
首先泊松分布描述的是:一个时间段或一个区间内某事件发生次数的概率。公式是:f(x)=uxe−ux!f(x)=\frac{u^xe^{-u}}{x!}f(x)=x!uxe−u其中x指的是事件发生的次数,u是事件在一个区间发生次数的期望值或均值,f(x)代表事件发生x次的概率。测序原理有利用到泊松分布,那么测序中,“时间”或者“区间” 指的什么?“事件” 又是指的什么?按我理解:一句话描述:假设一个基因测了100次,每次拿到的序列称为区间,这个基因某个位点在这100个区间中出现的次数服从泊松
2021-12-08 14:01:01 1585
原创 文档数据库介绍
文章目录什么是文档型数据库?什么是文档(documents)什么是集合(Collections)文档型数据库的一些关键特性和关系型数据库的区别文档数据库和其他数据库之间的关系是什么?为什么不直接在关系型数据库中使用JSON结构文档数据库的缺点主流的文档数据库什么是文档型数据库?文档数据库(也称为面向文档的数据库或文档存储)是在文档中存储信息的数据库,是非关系型数据库的一种。 { "_id": 2, "first_name": "Donna", "email": "donn
2021-11-01 17:25:22 16930
原创 java实现多元线性回归
文章目录一个例子分析计算准备数据计算查看结果参考一个例子约翰逊过滤股份公司对遍布南佛罗里达州的水过滤系统提供维修保养服务。当顾客的水过滤系统出现故障时,他们就要与约翰逊公司进行联系,请求公司对他们的水过滤系统进行维修。为了估计服务时间和服务成本,约翰逊公司的管理人员希望对顾客的每一次维修请求预测必要的维修时间。所以,按小时计算的维修时间是因变量。管理人员认为,维修时间依赖两个因素:从最近一次维修服务至今水过滤系统已经使用的时间和需要维修的故障类型。由10次维修服务组成一个样本,有关资料数据如下1:
2021-03-13 14:53:05 4090
原创 多元回归分析中的分类变量(笔记)
两个水平如果分类变量只有两个水平(例如性别,男和女),我们只需要定义一个虚拟变量就可以了,用0表示男,用1表示女。超过两个水平当一个分类变量超过两个水平时,我们必须在定义虚拟变量和解释虚拟变量两方面谨慎从事。重点是要牢记:在多元回归分析中,如果一个分类变量有k个水平,那么需要在多元回归分析中定义k-1个虚拟变量。解释对于只有两个水平的分类变量很好理解,那么“在多元回归分析中,如果一个分类变量有k个水平,那么需要在多元回归分析中定义k-1个虚拟变量”该怎么解释呢?对于我们一开始很容易想到的问题,为
2021-02-20 10:20:06 19662 8
原创 一次内存溢出问题分析
文章目录问题描述问题分析1、查看jvm使用情况2、生成dump文件3、利用HeapAnalyzer软件进行分析4、使用eclipse插件分析5、在linux执行分析命令6、分析结果7、问题解决问题描述打开页面,页面卡死,后台报out of memory错误。问题分析1、查看jvm使用情况命令:jmap -heam [pid]发现堆内存的使用率已经达到了100%,总大小8g左右,并且一直不见下降。2、生成dump文件命令:jmap -dump:file=[] [pid]最后生成的文件有7g大
2020-07-04 14:46:04 713
原创 java实现简单线性回归—显著性检验
1、demopackage com.math.demo;import java.math.BigDecimal;import com.math.regression.RegressionEquation;import com.math.regression.RegressionModel;/*** * * @author miaoyibo * */public class RegressionDemo { public static void main(String[] arg
2020-07-04 14:39:59 1238
原创 NIO服务器示例(使用 select( )来为多个通道提供服务)
package com.nio.demo;import java.net.InetSocketAddress;import java.net.ServerSocket;import java.nio.ByteBuffer;import java.nio.channels.SelectableChannel;import java.nio.channels.SelectionKey;import java.nio.channels.Selector;import java.nio.channe
2020-06-28 17:10:30 341
原创 java实现简单线性回归—判定系数
判定系数 coefficient of determination 为估计的回归方程提供拟合优度的度量。代码1、demopackage com.math.demo;import com.math.regression.RegressionEquation;import com.math.regression.RegressionModel;/*** * * @author miaoyibo * */public class RegressionDemo { public
2020-06-23 15:00:32 1119
原创 管道(pipe)示例(带注释)
Pipe 说明管道可以被用来仅在同一个 Java 虚拟机内部传输数据。虽然有更加有效率的方式来在线程之间传输数据,但是使用管道的好处在于封装性。1codepackage com.nio.demo;import java.io.IOException;import java.nio.ByteBuffer;import java.nio.channels.Channels;import java.nio.channels.Pipe;import java.nio.channels.Readab
2020-06-23 10:05:57 775
原创 java实现简单线性回归
文章目录方法maven依赖实现代码方法最小二乘法。maven依赖 <!-- https://mvnrepository.com/artifact/net.sf.jsci/jsci --> <dependency> <groupId>net.sf.jsci</groupId> <artifactId>jsci</artifactId> <version>1.2</version>
2020-06-17 15:46:20 2521 1
原创 事务方法中使用truncate会发生什么
场景在一个spring项目的事务方法中(使用@transactional注解):首先执行一个delete语句;然后执行一个truncate语句;最后再执行一个insert语句;问题:为什么delete语句和truncate语句执行成功,但insert语句虽然执行了,却没有提交?解释:首先,在没有事务注解的方法中,一切与数据库的交互都是由mybatis处理的,而mybatis默认是...
2020-04-24 00:46:27 4146 2
原创 进程
目录定义进程描述符进程的基本信息指向内存区描述符的指针与进程相关的tty当前目录指向文件描述符的指针所接收的信号进程状态可运行状态(TASK_RUNNING)可中断的等待状态(TASK_INTERRUPTIBLE)不可中断的等待状态(TASK_UNINTERRUPTIBLE)暂停状态(TASK_STOPPED)跟踪状态(TASK_TRACED)僵死状态(EXIT_ZOMBIE)僵死撤销状态(EXI...
2020-04-10 19:23:34 153
原创 MySQL关于HANDLER命令的说明
文章目录一、 语法二、为什么要用HANDLER而不是“SELECT”语句一、 语法官方给出的格式:HANDLER tbl_name OPEN [ [AS] alias]HANDLER tbl_name READ index_name { = | <= | >= | < | > } (value1,value2,...) [ WHERE where_cond...
2020-03-20 09:15:39 644
原创 java实现Fisher的LSD方法
场景在成对的总体均值之间进行统计比较。maven依赖 <!-- https://mvnrepository.com/artifact/net.sf.jsci/jsci --> <dependency> <groupId>net.sf.jsci</groupId> <artifactId>jsci</artifa...
2020-03-15 13:20:51 1053
原创 conda修改配置
问题:服务器装了两个conda:conda1,conda2,默认使用的是conda2,想改成conda1方法:修改服务器配置文件打开配置文件:vim ~/.bashrc如果没发现conda配置,可能在另一个路径中:vim /etc/profile将其中目前的conda按照路径改成需要的路径然后使配置生效:source ~/.bashrcorsource /etc/p...
2020-03-11 14:12:46 806
原创 nginx安装记录
1、在安装nginx前首先要确认系统中安装了gcc、pcre-devel、zlib-devel、openssl-devel。检查命令:https://www.cnblogs.com/xxoome/p/5866553.html2、下载安装包wget http://nginx.org/download/nginx-1.10.2.tar.gz3、安装解压tar -zxvf nginx-1...
2020-03-11 14:03:12 166
原创 显著性水平和p值的理解
统计分析的核心是以随机样本推断整体;以H0代表原假设,H1代表它的相反面;显著性水平是指假设H0为真的情况下,发生H1的概率,其实我们抽取到的样本就是H1。显著性水平可以描述为:假设总体均值为10,我们抽取到的样本均值为6的概率即是显著性水平;假设总体是100个,如果根据样本计算出的p值等于0.05,也就是说:假设原假设成立,我们抽取到的样本必须是来自于这5个,才有可能发生“抽取到...
2020-03-07 18:37:20 16074
原创 java实现方差分析(ANOVA)
场景用于单因子分析实验中,多个总体均值之间的比较。maven依赖 <!-- https://mvnrepository.com/artifact/net.sf.jsci/jsci --> <dependency> <groupId>net.sf.jsci</groupId> <artifactId>jsci</...
2020-02-26 11:42:54 2143 1
原创 java实现独立性检验
maven依赖 <!-- https://mvnrepository.com/artifact/net.sf.jsci/jsci --> <dependency> <groupId>net.sf.jsci</groupId> <artifactId>jsci</artifactId> <versi...
2020-01-07 15:06:49 273
原创 java实现f检验
maven<dependencies> <!-- https://mvnrepository.com/artifact/net.sf.jsci/jsci --> <dependency> <groupId>net.sf.jsci</groupId> <artifactId>jsci</artifac...
2020-01-02 14:36:18 933 3
原创 java实现t检验
maven依赖 <!-- https://mvnrepository.com/artifact/net.sf.jsci/jsci --> <dependency> <groupId>net.sf.jsci</groupId> <artifactId>jsci</artifactId> <versi...
2019-12-31 17:08:48 1877 1
原创 Java科学计算包JSci介绍(一)
统计学篇正态分布计算Class NormalDistribution1、平均值 /** * 标准正态分布 * 平均值 * @param args */ public static void main(String[] args) { NormalDistribution nd=new NormalDistribution(); System.out.println...
2019-12-30 17:38:02 2639 2
原创 HTTP几种连接方式
HTTP连接的几种方式串行连接此时一个连接对应一个请求,一个请求完成后才会开始下一个请求。完成的标志是服务端的数据到达客户端,客户端读取响应数据后关闭连接,然后发起下一个连接。持久化连接此时一个连接可以发送多个请求,一个请求完成后,并不会关闭连接,而是等待下一个请求执行。管道化连接持久化连接下的一种方式,客户端会将多个请求排队,在一个连接上发送给服务器,和持久化连接不同的是,管道化连接...
2019-12-26 08:48:18 4069
原创 什么时候使用泊松分布
什么时候使用泊松分布?泊松分布性质判断泊松分布性质在任意两个相等长度的区间上,事件发生的概率相等;可以理解为任意两个区间发生1次事件的概率相等,或发生同样次数的概率相等。事件在某一区间上是否发生与事件在其他区间上是否发生是独立的;判断相比其他统计学指标,计算泊松分布概率需要提前知道的参数要少的多:只需要知道某一区间上事件发生次数的平均值,当然前提是场景要满足泊松分布的性质。比如,...
2019-12-21 15:19:14 5961
原创 异常值的检测
异常值的检测z-分数经验法则总结z-分数利用平均数和标准差,我们可以确定任何观察值的相对位置。假设我们有一个n个观测值x1,x2,…xn的样本,并且假设样本平均数和样本标准差已经被计算出来。与任何一个数值有关的另一个数值称为z-分数:用样本中的数值减去样本总的平均值,然后除以样本标准差。一个变量的数值转换成z-分数的过程常常被称为z变换。经验法则经验法则以正态分布为依据,用来确定与平均...
2019-12-13 16:59:56 2762
原创 箱线图的几种计算方法比较
一、绘制箱线图所需要的几个指标q1:下四分位数q2:中四分位数q3:上四分位数上限和下限:由q3和q1计算得出。二、计算方法1、“n+1”方法 来源:网络(1)确定四分位数的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的项数。(2)根据位置,计算相应的四分位数 2、“n-1”方法 来源:网络(1)确定四分位数的位置。...
2019-07-17 17:39:12 13071 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人