自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 资源 (3)
  • 收藏
  • 关注

原创 卡方检验及其Python实现

分类数据的拟合优度检验独立性检验分类数据的拟合优度检验前面我已经写了关于几种常见的假设检验内容,而检验主要是测试样本分类数据的分布是否符合预期分布。相信大家如果学过高中生物,都知道孟德尔...

2020-11-27 12:00:00 30

原创 Pandas绘图功能

柱状图箱线图密度图条形图散点图折线图保存绘图总结可视化是用来探索性数据分析最强大的工具之一。Pandas库包含基本的绘图功能,可以让你创建各种绘图。Pandas中的绘图是在matplot...

2020-11-06 22:30:28 22

原创 概率密度函数的核估计

importnumpyasnpimportmatplotlib.pyplotaspltimportseabornassnssns.set()fromscipy...

2020-10-30 14:57:42 48

原创 假设检验在数据分析中的应用

前言Z检验T检验独立样本t检验配对样本t检验单样本t检验前言在这篇文章中,我不会具体去推导检验统计量和相应拒绝域的得出,这对于大部分非统计学专业的人士来说是晦涩的,我只想通过一个案例告诉...

2020-09-28 11:39:06 64

原创 Scipy使用简介

物理常量常用单位special函数库非线性方程组求解最小二乘拟合计算函数局域最小值计算全域最小值解线性方程组最小二乘解特征值和特征向量连续概率分布离散概率分布核密度函数二项分布,泊松分布...

2020-09-15 13:03:41 316

原创 用Scipy求解单个正态总体的置信区间

区间估计简介Python求解单个正态总体参数的置信区间参考区间估计简介假定参数是射击靶上 10 环的位置,作一次射击,打在靶心 10 环的位置上的可能性很小,但打在靶子上的可能性就很大,...

2020-08-28 22:24:48 148

原创 为什么随机误差服从正态分布?

前言正态分布的导出python绘制图像前言正态分布分布在概率论与数理统计中处于核心地位。它最初作为二项分布计算的渐近公式由棣莫弗引进,后被拉普拉斯发展成系统的理论,但把它作为一个分布来进...

2020-08-17 08:22:15 639

转载 Python才是世界上最好的语言

【文末领取限免课程】Python是人工智能的未来。前不久中国经济学会(CEA)发布了顶级编程语言交互排行榜:Python超越Java高居首位。而且随着大数据和人工智能的发展,Python...

2020-08-10 08:00:02 88

原创 蒙特卡洛法求积分

问题一:我们如何用蒙特卡洛方法求积分?问题二:如何近似求一个随机变量的数学期望?问题三:估计的误差是多少?问题四:如何从理论上对蒙特卡洛估计做分析?结论importnumpyasn...

2020-08-06 22:49:08 253

原创 交叉验证

概述Holdout 交叉验证K-Fold 交叉验证Leave-P-Out 交叉验证总结概述交叉验证是在机器学习建立模型和验证模型参数时常用的办法。顾名思义,就是重复的使用数据,把得到的样...

2020-07-19 14:05:03 98

原创 Python统计分析

描述性统计偏度和峰度累计值假设检验和区间估计示例1假设检验置信区间示例2假设检验置信区间描述性统计#导入相关的包importpandasaspdimportnumpyas...

2020-07-08 21:10:32 67

转载 数据特征分析

分布分析对比分析统计分析帕累托分析正态性检验相关性分析分布分析分布分析 → 研究数据的分布特征和分布类型,分定量数据、定性数据区分基本统计量极差 / 频率分布情况 / 分组组距及组数im...

2020-07-06 17:14:46 221

原创 高斯过程

高斯过程的理论知识非参数方法的基本思想高斯过程的基本概念高斯过程的Python实现使用Numpy手动实现使用`Scikit-learn`实现高斯过程小结高斯过程GaussianProce...

2020-06-24 23:03:13 502

原创 高斯过程

高斯过程的理论知识非参数方法的基本思想高斯过程的基本概念高斯过程的Python实现使用Numpy手动实现使用`Scikit-learn`实现高斯过程小结高斯过程GaussianProce...

2020-06-24 23:03:13 374 1

原创 ROC曲线

关键词 随机森林分类器5折交叉验证ROC曲线AUC可视化importmatplotlib.pylabaspltfromscipyimportinterpfromskle...

2020-06-20 23:23:46 41

原创 混淆矩阵

混淆矩阵是一个表,经常用来描述分类模型(或“分类器”)在已知真实值的一组测试数据上的性能。混淆矩阵本身比较容易理解,但是相关术语可能会令人混淆。让我们从一个二进制分类器的混淆矩阵示例开始...

2020-06-10 16:28:29 35

原创 为什么"十赌九输"?赌博中怎么才能使获胜概率最大?​

1685年,伯努利也是以研究赌博术为目的开始写作一部真正奠定“概率论”基础的历史性巨著《猜度术》,在这本著作当中,他创立了概率论中的第一极限定理:“伯努利大数定律”。“大数定理“与“中心...

2020-06-03 18:20:56 25

转载 疫情期间大学生在线学习效果调查报告

前言新冠疫情期间,为响应教育部的“停课不停学”,各高校学生在疫情期间通过网络在线学习课程。本文对疫情期间的大学生在线学习效果及影响因素进行调查分析,一方面有利于掌握当前疫情背景下在线学习...

2020-06-01 21:22:28 5938

原创 隐马尔科夫模型

公式推导HmmlearnGaussianHMMGMMHMMMultinomialHMM股票走势预测特征准备建立模型可视化短线预测参考资料HMM公式推导 在 HMM 中,有两个基本假设:齐...

2020-05-29 22:49:26 48

原创 蒲丰投针问题

问题描述数学解法Python模拟18世纪法国科学家Buffon提出的一种计算圆周率π的方法——随机投针法,就是用一枚普普通通的针就可以计算出圆周率,是不是很神奇,现在带着你的疑惑和我...

2020-05-24 22:16:54 79

原创 特征工程之缺失值处理
原力计划

文章目录缺失值处理直接删除统计值填充统一值填充前后向值填充插值法填充预测填充KNN填充具体分析缺失数据可视化微信公众号:邯郸路220号子彬院 获取更多内容缺失值处理一般来说,未经处理的原始数据中通常会存在缺失值、离群值等,因此在建模训练之前需要处理好缺失值。缺失值处理方法一般可分为:删除、统计值填充、统一值填充、前后向值填充、插值法填充、建模预测填充和具体分析7种方法。直接删除理论...

2020-04-16 09:45:38 671

原创 随机样本的生成
原力计划

文章目录如何生成一个随机变量/随机向量的随机样本?1. 连续型随机变量离散型随机变量随机向量Markov 链的一个轨道与其极限分布的关系如何生成一个随机变量/随机向量的随机样本?import random, mathfrom typing import Listimport matplotlib.pyplot as pltimport seaborn as snsimport num...

2020-03-24 18:47:21 372

原创 常见统计分布的概率分布图
原力计划

文章目录Normal distributionχ2\chi^2χ2 distributiont-distributionF-distributionBeta distribution对中心极限定理的验证import numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy import statss...

2020-03-21 17:08:06 921

原创 用python预测疫情发展
原力计划

文章目录什么是传染病动力学?numpy和matplotlib用python实现传染病模型SI模型SIS模型SIR模型SEIR模型什么是传染病动力学?最近,在报道疫情的众多新闻中,相信大家也看到过一些来预测新型冠状病毒会导致感染肺炎的人数。你一定好奇,这个人数要怎么预测呢?预测人数又有什么用呢?事实上,从学科方向来说,这类研究属于传染病动力学,就是用数学模型去描述传染病在人群中传播的规律,从而...

2020-03-13 20:50:30 4512 2

原创 用Python实现遗传算法
原力计划

文章目录优化问题概述遗传算法简介模型引入:函数寻优问题形象理解数学原理/实现过程一些概念编制袋鼠的染色体----基因的编码方式二进制编码法浮点数编码只编码主要特征物竞天择--适应性评分与及选择函数物竞――适应度函数(fitness function)天择――选择函数(selection)轮盘赌(Roulette Wheel Selection)选择法——选择繁衍的袋鼠遗传变异――基因重组(交叉)与...

2020-03-10 20:15:43 2544 3

原创 传染病模型——波利亚坛子

文章目录问题描述问题解答问题描述坛子中有b只黑球及r只红球,随机取一只,把原球放回,并加进与抽出球同色的球c只,再摸第二次,这样下去一共摸了n次,问前面的n1n_{1}n1​次出现黑球,后面的n2=n−n1n_{2} = n-n_{1}n2​=n−n1​次出现红球的概率是多少?问题解答用A1A_{1}A1​表示第一次摸出黑球这一事件,…,An1A_{n_{1}}An1​​表示第次摸出黑球,...

2020-03-01 16:57:42 1217

原创 模型正则化

文章目录模型正则化欠拟合与过拟合线性回归模型2次多项式回归4次多项式回归评估3种回归模型在测试数据集上的性能表现L1范数正则化Lasso模型在4次多项式特征上的拟合表现L2范数正则化模型正则化任何机器学习模型在训练集上的性能表现,都不能作为其对未知测试数据预测能力的评估。要重视模型的泛化力(Generalization)。本文将详细解释什么是模型的泛化力,以及如何保证模型的泛化力。欠拟合与过拟...

2020-03-01 16:46:12 388

原创 复旦大学概率论与数理统计861真题

内容包括,2018,2019,2020真题获取方式:关注微信公众号:邯郸路220号子彬院 ,任选公众号内一篇文章发到朋友圈或QQ空间,2小时候截图发给后台获取资料...

2020-02-26 19:27:52 633 1

原创 PCA实例

文章目录PCA的形象说明导入数据PCA后可视化建立模型性能评测特征降维有两个目的:其一,我们会经常在实际项目中遭遇特征维度非常之高的训练样本,而往往又无法借助自己的领域知识人工构建有效特征;其二,在数据表现方面,我们无法用肉眼观测超过三个维度的特征。因此,特征降维不仅重构了有效的低维度特征向量,同时也为数据展现提供了可能。在特征降维的方法中,主成分分析(PrincipalComponentAn...

2020-02-22 15:32:30 321

原创 K_means

导入数据#分别导人numpy、matplot1ib以及pandas,用于数学运算、作图以及数据分析。import numpy as npimport matplotlib.pyplot as pltimport pandas as pd #使用pandas分别读取训练数据与测试数据集。digits_train = pd.read_csv('https://archive.ics.uci...

2020-02-20 13:17:28 86

原创 随机森林算法实现分类

文章目录导入数据导入pandas,并且重命名为pd。数据导入数据处理建立模型模型评估更多内容关注公众号:邯郸路220号子彬院导入数据导入pandas,并且重命名为pd。import pandas as pd#通过互联网读取泰坦尼克乘客档案,并存储在变量titanic中。titanic = pd.read_csv( ‘titanic.txt’)#引入pandas,并且重命名为pd。将熊...

2020-02-16 19:01:30 469 1

原创 K近邻实现分类案例

数据载入将使用Iris数据集#从sklearn.datasets导人iris数据加载器。租from sklearn.datasets import load_iris#使用加载器读取数据并且存人变量iris.iris=load_iris ()#查验数据规模。iris.data.shape(150, 4)#查看数据说明。对于一名机器学习的实践者来讲,这是一个好习惯。print...

2020-02-14 18:18:08 169

原创 支持向量机实现分类案例

导入数据#从sklearn.datasets里导人手写体数字加载器。from sklearn.datasets import load_digits#从通过数据加载器获得手写体数字的数码图像数据并储存在digits变量中。digits = load_digits()#检视数据规模和特征维度。digits.data.shape(1797, 64)输出表明:该手写体数字的数码图像数...

2020-02-13 17:16:47 811

原创 决策树算法实现分类案例

文章目录导入数据数据预处理模型评估导入数据#导人pandas用于数据分析。import pandas as pd#利用pandas的readcsv模块直接从互联网收集泰坦尼克号乘客数据。titanic= pd.read_csv ('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt')#观察前几行数据,...

2020-02-12 13:11:14 529

原创 Jupyter Notebook个性化设置方法

文章目录如何更换主题用pip进行装包设置主题jupyterthemes 的参数设置说明结果展示个人公众号:邯郸路220号子彬院作为数据分析的爱好者, jupyter notebook 在平时使用的频率很高。但经常觉得 jupyternotebook 默认的风格不是很爽,总想换一换。今天,来分享下给 jupyter notebook 更换主题等内容的方法。如何更换主题Jupyter Note...

2020-02-10 14:18:33 908

复旦大学2019概率论与数理统计861.pdf

19学硕真题

2020-02-26

2020年复旦大学861专业课真题.pdf

其他年份真题我也都上传至我的CSDN

2020-02-26

贝叶斯拼写检查

用python写的哦,anaconda才能运行哦

2018-08-26

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除