- 博客(49)
- 资源 (1)
- 收藏
- 关注
原创 自由能(Free Energy)(一)
前言假设一个场景,你在球场投篮,那么你是如何完成这个投篮动作呢?你的大脑会先根据抛物线公式计算一下角度高度等,甚至考虑微弱的风向吗?显然是不可能的,我们的大脑可能就是预估大概这个力度、角度,篮球是否会中,并且在篮球抛向球筐的过程中,我们的大脑还会不断的修正我们一开始预测的结果。那么我们大脑是如何根据观察到的东西来进行预测以及动作呢?我们知道,我们大脑其实就仅仅只有各种感官数据的输入,并没有关于环境真实的状态。假设 Xhypothese∈RnX_{hypothese} \in R^nXhypothese
2022-05-17 14:34:04 1523
原创 记录有关假设检验方面的学习。
什么是零假设(Null hypothesis)?零假设是做统计检验时的一类假说,一般零假设的内容是希望能证明为错误的假设。比如,在相关性的检验中,一般会取”两者之间无关联“作为零假设,而在独立检验中,一般会取”两者之间非独立“作为零假设。零假设内容通常由研究人员自己决定。什么是备择假设?备择假设就是与零假设相对的假设,一般其内容希望能证明为真。零假设与备择假设地位上是相等的。假设零假设是:AB两者之间非独立,那么备择假设就是:AB两者之间独立。什么是I类错误?I类错误指的是:如果一个统计检验.
2021-09-14 15:13:21 335
原创 ANM(Nonlinear causal discovery with additive noise models)
在上一篇文章中讲了什么是Direct-LiNGAM,讲了当数据背后的生成机制是线性的时候,我们如何从数据中恢复出其背后的因果结构,现在讲线性推广开了,当数据背后的生成机制是非线性时,我们给该如何进行因果关系发现!
2021-09-03 17:01:41 3501 2
原创 Direct-LiNGAM算法理解
现在是大数据的时代,数据即是财富。那么如何从数据中发现因果关系呢?这是我们促进我们更加高效利用数据的一个问题?本文介绍了一种方法,可以在符合条件的观察数据中恢复出数据背后的因果结构,帮助我们更好理解数据的产生机制。
2021-09-02 19:59:24 3336 2
原创 后门准则(Backdoor Criterion)与前门准则(Frontdoor Criterion)
1.后门准则定义:给定有向无环图(DAG)中一对有序变量(X,Y),如果变量集合Z(可以为空)满足:Z中没有X的后代节点。 Z阻断了X与Y之间的每条含有指向X的路径。满足以上两点的Z,就称Z满足关于(X,Y)的后门准则。如果变量集合Z满足(X,Y)的后门准则,那么X对Y的因果效应可以由下面的公式计算。证明如下:一般而言,我们希望节点Z最好可以满足下面这些条件:阻断X和Y之间的所有伪路径(即所有指向X的路径)。 保持所有X到Y的有向路径不变。 不会产生新的伪路径。(例.
2021-07-12 14:00:49 19300 14
原创 因果图模型与d-分离
一般图都是由链结构(chain)、分叉结构(fork)、对撞结构(collider)这三种结构所组成,通过组合这三种结构,可以形成复杂图模型。下面分别介绍这三种结构,以及对应的Rule.1、链jiego
2021-06-04 10:35:25 3313 7
原创 二元回归方程中的斜率b与协方差的关系
最近在《Causal inference in Statistics:A primer》(统计因果推理入门)的第一章1.3.10中看到这样一句话,即若Y关于X的回归方程为y=a+bx,则斜率b可以用协方差计算,即:b=RXY=σXYσX2b = R_{XY}=\frac{σ_{XY}}{σ_{X}^2}b=RXY=σX2σXY那么上述等式是如何得到的?答案是通过借助期望得到的,当然b还有另一种表示形式。即:b=∑(xi−xˉ)(yi−yˉ)∑(xi−xˉ)2b =\frac{∑(x_i-
2021-05-26 13:57:22 2611
原创 与好友“浩南“除夕讨论DTO,entity(POJO),VO有感
首先声明下面是个人所想,并不一定正确,大家有不同的想法,欢迎在下方评论区进行讨论,多交流才能有不一样的理解!1.先说明DTO与VO定义,entity就不说了,大家都懂。DTO:数据传输对象(DTO)(Data Transfer Object),是一种设计模式之间传输数据的软件应用系统。数据传输目标往往是数据访问对象从数据库中检索数据。数据传输对象与数据交互对象或数据访问对象之间的差异是一个以不具有任何行为除了存储和检索的数据(访问和存取器)。VO:这里的VO是指(View Object)视图对象
2021-02-12 00:28:54 1961 5
原创 基于Python——Kmeans聚类算法的实现
1、概述本篇博文为数据挖掘算法系列的第一篇。现在对于Kmeans算法进行简单的介绍,Kmeans算法是属于无监督的学习的算法,并且是最基本、最简单的一种基于距离的聚类算法。下面简单说一下Kmeans算法的步骤:选随机选取K的簇中心(注意这个K是自己选择的)计算每个数据点离这K个簇中心的距离,然后将这个点划分到距离最小的簇中重新计算簇中心,即将每个簇的所有数据点相加求均值,将这个均值作为...
2020-03-31 22:57:14 2076
原创 MyBatis 查询数据,赋值给List集合时,数据缺少问题。
今天在使用MyBatis查询数据时,发现查出来的数据和List集合的大小不一致,如下图所示,Total为3,但是list集合size为2. List<ArticleCommentToShow> commentsByArticleId = articleCommentService.getCommentsByArticleId(article.getArticleId(...
2020-02-15 20:48:24 2539
原创 Java Web——基于Servlet、JSP(无框架版)电影网站项目总结 (二,完结版)
今天来谈谈项目的“基石”——数据库,在这个项目中,我设计了7张表,如下图所示:allmovies:存放所有电影的相关信息clicknumber:记录每一部电影的被点击次数,collection:电影收藏表,记录用户收藏的电影comments:电影评论表,记录电影的评论history:浏览记录表,记录用户的浏览电影记录score:评分表,记录用户对电影的评分(不过该表暂未...
2020-01-02 22:01:53 4047 9
原创 Java Web——基于Servlet、JSP(无框架版)电影网站项目总结(一)
这学期在学习Java Web,于是花了大概一个礼拜的时间把书看了一遍,动手敲了一遍。自己一个人做了电影网站小项目作为练手,项目地址如下:http://120.27.192.30/movie/。访问最好使用谷歌浏览器(因为没考虑兼容,所以其它浏览器访问会出现些问题)前后台都写了,后台界面后续会放出来,在写项目期间,花了很多时间在前端的界面设计、效果的实现上,虽然用了网上现成的资源,但是将这些东西...
2019-12-14 19:54:21 5868 8
原创 Java并发编程实战——学习笔记(一)
一、线程安全性在线程安全性中,最核心的概念是正确性,而正确性的含义是:某个类的行为与其规范完全一致。这里的规范可以粗略理解为在各种限定条件下,类对象的结果与预期一致。在单线程中,正确性可以近似的定义为“所见即所知(we know it when we see it)”。在大概明确了“安全性”的概念后,我们可以认为线程安全性就是:当多个线程访问某个类时,这个类始终都能表现出正确的行为,那么这个类...
2019-12-02 15:38:00 573
原创 Java——反射
什么是反射?答:能够分析类能力的程序称为反射(reflective)。反射机制可以用来干嘛?答:1.在运行时分析类的能力 2.在运行时查看对象,例如toString方法。 3.实现通用的数组操作代码。4.利用Method对象。在程序运行期间,Java运行时系统始终为所有的对象维护一个称为运行时的类型标识。这个信息跟踪着每个对象所属的类。虚拟机利用运行时类型信息选择相应的...
2019-10-16 15:06:22 287
原创 HTML+CSS 实现下拉三级菜单
代码如下:<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <meta http-e...
2019-10-10 20:11:03 4816
原创 Python-函数注解
在Python3 中提供了一种句法,用于为函数声明中的参数和返回值附加元数据。下面是添加了注解后的一个函数示例:def clip(text:str, max_len:'int > 0'=80) ->str: # 有注解的函数声明 """在max_len前面或后面的第一个空格处截断文本""" end = None if len(text) > max...
2019-10-05 16:10:15 647
原创 流畅的Python——字典
1.在Python中标准库中所有映射类型都是利用dict来实现的,因此它们有个共同的限制,即只有可散列的数据类型才能用作这些映射的键,注意只有键有这个要求,值并不需要是可散列的数据类型。在Python中原子不可变数据类型(str、bytes和数值类型)都是可散列类型,frozenset也是可散列类型,因为根据其定义,frozenset里只能容纳可散列类型。元组的话,只有当一个元组里包含的所有...
2019-09-23 22:38:00 372
原创 流畅的Python第二章-学习笔记
"""Python的内置序列:1.按类型分类:1.容器序列:list、tuple和collections.deque这些序列能存放不同类型的数据2.扁平序列:str、bytes、bytearray、memoryview和array.array,这类序列只能容纳一种类型容器序列存放的是它们包含的任意类型对象的引用,而扁平序列里存放的是值而...
2019-09-21 23:03:21 227
原创 利用opencv实现检测特定颜色物体,并追踪其移动
写在前面:思路、代码方法参考了https://github.com/akshaybahadur21利用OpenCV将实时读取视频流,将每一帧的图像转换为hsv类型,将特定hsv颜色区间的物体的像素值置为255,将区间之外的像素值置为0,形成黑白图像,再利用erode对图像进行腐蚀消除部分噪音区域和dilate对图像进行膨胀,将检测到的物体放大,最后在进行绘制操作。特别注意:因为我用的是绿色...
2019-08-21 18:07:44 5600 7
原创 MySQL基本操作(一)
一、基本操作 show databases; 显示所有数据库 use 数据库名称; 使用某数据库 show tables; 显示数据库中的所有表 select * from 表名; 显示查看表的所有内容 ...
2019-08-15 12:25:34 267
原创 Python面试题—字典的坑
下面是一道面试题m = {1: 2, 3: 4}for k, v in m.items(): m[k + 2] = v + 2l = ml[9] = 10func(1)m[7] = 8问:l 和 m 的内容分别是啥。注意:1.在这里,这个程序运行不了会报错,因为在循环中遍历字典的时候,不能做涉及字典的键的操作。2.l = m 是浅拷贝,所以当注释了func(1)时,...
2019-07-17 15:54:36 696
原创 html之圆形用户头像
实现圆形的用户头像代码如下:<!DOCTYPE html><html><head> <meta charset="utf-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <title>头像圆形化处理</title> <lin...
2019-07-13 16:07:10 5551
原创 html学习之路(二)——form表单和CSS一些基本情况
1.form表单前后端有数据交互时一般用form表单。下面是一个form表单的示例:<form action="day02_submit" method="get" accept-charset="utf-8" enctype="multipart/form-data"> <p> 用户名: <input type="text" name=...
2019-07-13 00:10:40 336
原创 html学习之路(一)——标签
<h>标签一般也叫标题标签,效果如下 <h1>标题大小</h1> <h2>标题大小</h2> <h3>标题大小</h3> <h4>标题大小</h4> <h5>标题大小</h5> 不添加h标签的标题大小<a>标签,<a h...
2019-07-06 17:49:11 157
原创 Kears+Opencv实现简单的人脸识别Demo
写在前面:这篇文章也是借鉴了一些前辈的代码和思路写的,代码有些也是复用了别人的。先说下思路:1.首先利用Opencv检测出人脸的区域 2.在成功的检测出人脸区域后,将识别出的人脸区域截取成图片,储存起来,用作后续的训练数据。 3.在获取到了足够多的数据后,搭建CNN网络进行训练。 5.训练完成后,将模型存储起来。 6.在利用Opencv实时读取视频流,将检测出人脸的区域变成图片放入模型...
2019-06-01 13:30:14 733
原创 Tensorflow + 基于CNN神经网络的面部表情识别
最近在学习使用Tensorflow框架,在学习到了CNN卷积神经网络的时候,跟着书上写了一个基于CNN网络的一个面部表情识别的小项目。说一下我的硬件设备:CPU:G4560,,这什么年代了,我还在用4560,你敢信??滑稽----GPU:GTX1050 4G我的python版本是3.6,Tensorflow版本是1.5在这里我使用的Tensorflow-gpu版本是1.5的,,...
2019-05-10 16:43:33 8579 16
原创 python——网络编程之基于TCP协议的文件上传和下载
在这里我实现的是客户端上传文件,服务器接收文件,如果要实现客户端从服务器上下载文件的话,直接将代码反过来即可。废话不多说,下面直接上代码吧。下面是服务器端的代码import socketimport structimport jsonsk = socket.socket()sk.bind(('127.0.0.1', 8888)) # 绑定ip地址和端口sk.listen()...
2019-05-01 20:34:00 2518
原创 python-递归简单描述和一些实例
'''什么是递归:在函数中调用自身函数.最大递归深度默认是997/998 —— 是python从内存角度出发做得限制RecursionError: maximum recursion depth exceeded while calling a Python object递归的错误,超过了递归的最大深度import syssys.setrecursionlimit(1000000)...
2019-03-18 21:34:36 827
原创 python之内置函数简单介绍
'''lambda函数的格式:lambda n:a**an为参数,多个参数用逗号隔开,冒号之前都是参数 冒号后面就是返回值'''# def add(x,y):# return x+y# add = lambda x,y:x+y# print(add(1,2))# dic={'k1':10,'k2':100,'k3':30}# def func(key):# ...
2019-03-05 21:30:36 156
原创 python之内置函数介绍
''' 内置函数:通俗点将,只要不经过def定义的,直接能带括号()使用的方法就是内置函数'''# 与作用域相关的两个内置函数# print(locals()) # 返回本地作用域中的所有名字# print(globals()) # 返回全局作用域中的所有名字# 迭代器、生成器相关的三个内置函数# 迭代器.__next__() = next(迭代器)# iter(可迭代的)...
2019-03-05 21:02:19 213
原创 机器学习第五章笔记——Logistic回归
简述:假设现在有一些数据点,我们用一条直线对这些点进行拟合(该线就称为最佳拟合直线),这个拟合过程就称作回归。当数据是线性可分的时候,我们可以利用最小二乘法来进行拟合,来进行分类。当数据是线性不可分的时候,最小二乘法就不可以使用了(或者分类的效果很差很差),当数据是线性不可分的时候我们就可以利用Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。基...
2019-03-01 23:02:14 560
原创 机器学习实战之朴素贝叶斯
基于概率论的分类方法:朴素贝叶斯目录1.基于贝叶斯决策理论的分类方法2.条件概率3.使用条件概率来分类4.使用朴素贝叶斯进行文档分类5.使用python进行文本分类6.使用朴素贝叶斯过滤垃圾邮件1.基于贝叶斯决策理论的分类方法朴素贝叶斯优点:在数据较少的情况下仍然有效,可以处理多类别问题缺点:对于输入数...
2019-02-28 00:06:05 213
原创 机器学习之决策树(基于ID3算法实现)(python代码实现)
上图所示的就是一个决策树,长方形代表判断模块,椭圆形代表终止模块,表示已得出结论,可以终止运行,左右箭头称作分支。 决策树的工作原理简单来说就是通过一系列条件判断来将数据分类,最终形成一个树状结构。数据集中的每个数据都可以顺着决策树的条件判断找到符合这个数据的类。 决策树的优势在于数据形式非常容易理解,决策树的一个重要任务就是为了理解数据中所蕴含的知识信息,因此决策树可以使用不熟悉的...
2019-02-24 22:46:07 2184 1
原创 机器学习之K近邻算法(KNN算法)
KNN算法可以说是机器学习分类中最简单的一种算法了,KNN算法的工作原理是:存在一个样本数据集,也称训练样本集,在这个样本集中每个数据都存在其对应的标签,即我们知道样本集中每一数据与所属分类的对应关系。当我们输入需要预测的数据时,我们将预测数据的每个特征与样本集中对应的特征进行比较,然后提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前K个最相似的数据,这就是KNN...
2019-02-22 20:08:01 486
原创 python------生成器粗略解读
''' 生成器函数: 只要含有yield关键字的函数都是生成器函数,且该关键字只能写在函数里,并且yield不能与return共用 特点: 调用函数之后函数不执行,返回一个生成器 每次调用__next__方法后会取到一个值,知道取完最后一个,再执行__next__(or next())会报错 生成器本质上就是迭代器 生成器的表现形式: ...
2019-02-19 23:14:55 150
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人