自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 统计机器学习笔记2——评价模型精度

“在统计学中没有免费的午餐”,也就是说,没有任何一种方法在任何一个数据集中都比其它的方法好。在实践中,针对每一个数据集选择最好的方法非常重要。

2022-05-26 11:37:10 1091 2

原创 统计机器学习笔记1--AI背景概论,损失函数,风险,,,

摘要期末来临,平时没怎么整理,听得有些零碎。抽点时间把它从头到尾捋一遍,也方便写综合实验的论文。文章目录摘要背景人工智能(Artificial Intelligence)机器学习数学理解常见的损失函数期望损失经验风险总结背景Q1. 什么是统计机器学习?人工智能 和 统计学习,机器学习是人工智能的核心。机器学习还包括很流行的深度学习。人工智能(Artificial Intelligence)定义:研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新兴技术科学。理

2022-05-25 22:09:53 292

原创 “The Gentle Lentil Restaurant“ Case Solution Report 模型与决策-温柔小扁豆餐厅例题

来自文敏的某次作业,瞎写的。语法错误欢迎指出,请勿批评

2022-05-07 22:55:50 765

原创 多元统计分析--判别(距离判别、Fisher判别、Bayes判别)

摘要与聚类不同的是,判别分析中,已知样本分类的前提(历史分组信息),利用历史数据,将给定的新样品按照某种准则判给某类。在机器学习中,可以理解为有监督学习。文章目录摘要目标样品到总体的马氏距离距离判别法基本思想Fisher判别法主要思想两总体Fisher判别Bayes判别法主要思想最大后验判别准则最小平均误判代价准则练习目标寻找一种“分类规则”即判别函数,来描述或区别多个群体的差异。样品到总体的马氏距离设有一总体G,其均值为μ\muμ, 其协方差为Σ=(δij)p×p\Sigma=(\delta_

2021-12-25 18:06:32 8975

原创 多元统计分析--聚类分析(系统性聚类、K均值聚类)

摘要系统聚类分为Q型聚类与R型聚类。前者对样品进行聚类,后者对变量进行聚类。在本文中,我们探讨对样品的分类。文章目录摘要主要思想相似性的度量系统聚类主要思想聚类,在样品没有给定历史分类信息的前提下,仅依靠样品之间的相似性进行分类。对于“相似”的样品,将其分为一类。而这种相似性,将要依靠“距离”进行度量。相似性的度量正如上述所说,根据样品间的相似性(靠近程度)进行聚类,样品间的靠近程度就利用距离进行衡量。每个拥有p个变量观测值的样品可以看作p维空间中的一个点,若存在n个样品,即该空间就存在n个点

2021-12-25 11:18:04 4316

原创 Linux运维--进程管理、系统资源查看、定时任务

摘要运维的目的是为了保证企业信息数据的持续可用性和绝对安全性。文章目录摘要进程管理进程进程管理命令系统资源查看计算机资源资源管理任务管理重要数据的备份文件系统备份进程管理进程在Linux系统中,任何一个进程都有父进程和一个唯一进程ID号。运行一个程序是,操作系统首先产生一个进程(分配内存、读入代码、建立进程控制块),将其插入就绪队列中等待CPU调度。启动Linux并执行完内核初始化后首先启动1号进程(默认是/sbin/init),其父进程ID号为0。每一个进程在任何时刻只能处于一种

2021-12-18 17:45:58 1317 1

原创 bash脚本程序语法Linux

摘要Shell程序,就是把需要计算机执行的Linux命令罗列到一个文件,再加上控制语句。解释型语言,不需要编译,即脚本文件。Linux下常用的用户登录Shell有Bash,sh,csh,tcsh,ksh,它们同时也是Shell程序解释器。解释器不同,语法也有些差别。Bash是Linux默认的Shell程序解释器。文章目录摘要创建步骤结构与基本语法变量控制语句顺序结构:分支结构循环结构Shell程序调试创建步骤新建一个文件并打开touch filename or vim filenameVim

2021-12-15 13:41:28 3165 2

原创 Monte Carlo Integration 蒙特卡罗方法求积分 附简单例题+代码

摘要蒙特卡罗积分是一种基于随机抽样的统计方法。打个比方,要想知道抛出硬币得到正面的概率,随机投1000次,得到500次左右,推测出概率应该为12\frac{1}{2}21​。差不多是这意思,比较著名的例子是W.S.戈塞特使用随机抽样来研究现在被称为“学生t”统计数据的分布。随着计算机的出现及发展,该方法也得到发展。文章目录摘要方法概述上课例题书本例题课后习题方法概述计算∫abg(x)dx\int_a^b g(x)dx∫ab​g(x)dx理论基础:如果X是一个随机变量,其密度函数为f(x)f(x)f

2021-12-13 22:59:19 2351

原创 R Studio console控制台出现中文字符显示Unicode编码原因以及解决

摘要使用R Studio时,控制台(console)的中文字符输出,并不是utf-8编码显示中文,而是一堆Unicode编码。非常之折磨眼睛。原因之前一直用的是R Gui,我在里面试了一下,发现也有这个问题。那就应该不是R studio设置的问题。大概是这样(看左上角那一堆,本来是中文字的):查看一下现在在用的R版本,是4.0.4,比较新的了,感觉也没下多久。sessioninfo() 原因查了一下,说是版本过高。旧的4.0.3版本是没有这个问题的。我不想用旧版本,于是,又查了一下,

2021-12-11 17:28:32 3074 1

原创 分布式计算期中上机练习

摘要在R Studio中画出分布的概率密度曲线(质量密度曲线)以及分布函数。利用逆变换法和接受拒绝法生成随机数。一道简单的数据处理题。文章目录摘要题目答案第一题第二题第三题说明题目答案第一题(1) 给定x=2时,求该分布的概率密度函数值基分布函数的值,利用R自带函数或自行编写函数皆可x = 2lambda = 1y1 = dexp(x, lambda) #概率密度函数值y2 = pexp(x, lambda) #分布函数值1.(2) 分别绘出概率密度函数曲线和分布函数曲

2021-11-10 15:07:50 976

原创 分布式统计计算-----变换法生成随机数R studio

摘要除了概率逆变换,还有多种变换可以用来生成随机变量的样本。接下来会给出一些变换以及两个示例。文章目录摘要变换举例变换如果Z∼N(0,1)Z\sim N(0,1)Z∼N(0,1),则V=Z2∼χ2(1)V = Z^2 \sim\chi ^2(1)V=Z2∼χ2(1)如果 U∼χ2(m)U \sim \chi^2(m)U∼χ2(m)与V∼χ2(n)V \sim \chi^2(n)V∼χ2(n)相互独立,则 F=U/mV/nF = \frac{U/m}{V/n}F=V/nU/m​服从自由度为(m,n

2021-11-08 20:43:55 2631

原创 LINUX零碎基本知识点(为期末考试回忆)-文件上传下载,vim命令,文件操作命令,命令序列...

摘要有些细节容易忽略,这里特别总结一下常用的命令文章目录摘要如何远程实现对服务器及本机之间文件的上传和下载对于文本的操作(vi/vim编辑器)对文件的几个操作命令命令序列说明如何远程实现对服务器及本机之间文件的上传和下载首先,我们应该知道服务器的地址以及端号(端号一般默认22)如果想要进入指定用户目录,需要知道用户名以及密码基于SSH协议,有两个工具a. scp, 非交互式工具b. sftp, 交互式工具for example of a;#注意:当操作的对象为目录时,需要

2021-11-05 09:23:30 505 1

原创 Linux 文件系统、文件权限及管理、文件通配符

摘要Linux就像一个文件树,记住这棵树的结构时一个称职的Linux系统管理员必备的素质。文章目录摘要Linux目录树文件权限文件管理新建文件系统Linux目录树数据都是以文件的方式保存在硬盘分区上(交换区除外),尔一个分区上可能存在上万的文件,保存在各个目录下,众多目录形成父子关系的目录。Linux的根文件系统就是一颗倒树结构,这就是Linux目录树。如图所示:文件权限文件管理新建文件系统...

2021-11-03 19:57:33 219

原创 分布式统计计算-----接受拒绝法生成随机数

摘要假定X与Y是服从密度函数 f 和 g 的随机变量,存在一个常数c使f(t)/g(t)≤cf(t)/g(t)\le cf(t)/g(t)≤c对所有 t 都满足f(t)>0f(t)>0f(t)>0,则接受拒绝法可以用来生成X的随机样本。注:生成服从某分布的伪随机数,就是生成该分布的样本。有时写成随机数,有时写成样本。文章目录摘要正文总结正文步骤:找到服从一个密度函数 g 满足f(t)/g(t)≤cf(t)/g(t)\le cf(t)/g(t)≤c的随机变量Y,对所有t,都

2021-11-02 22:55:10 2751 1

原创 分布式统计计算------逆变换法生成随机数 - R Studio

摘要文章目录摘要几个缩写连续型分布情况下离散型分布情况下几个缩写pmf(probability mass function):概率质量函数。离散随机变量在各特定取值上的概率。只有离散型随机变量才有概率质量函数。PDF/pdf(probability density function):概率密度函数,简称密度函数。描述随机变量的输出值,在某个确定的取值点附近的可能性的函数CDF/cdf(cumulatative distributionfunction):累积分布函数,简称分布函数。是概

2021-11-01 14:27:59 10464 2

原创 Linux中用户、组管理及环境变量

摘要Linux操作系统是多用户、多任务系统——允许多个用户同时登陆Linux系统并同时启动多个任务。用户账号和用户组是进行身份鉴别和权限控制的关键。文章目录摘要多用户系统用户组用户与组管理用户管理组管理用户登录过程用户变量设置用户切换记忆检查多用户系统动态的Linux系统(多用户运行级别)允许多个已经注册的用户同时登录并使用计算机。登陆方式:图形界面方式和字符界面方式,每种方式都有两种模式。见下图:相较而言,字符界面可以完成全部功能且效率高,它的默认虚拟终端数有6个。图形界面可完成部分功能,默认

2021-10-28 21:23:11 465

原创 Linux 硬盘分区、分区命名和分区格式化

开始Linux下只有根分区、交换分区和其他分区(比如数据分区、日志分区等,具体名字都可以自定义)。而且,一切皆文件。目录开始分区和分区命名硬盘的磁道和扇区三级目录分区和分区命名硬盘的磁道和扇区三级目录...

2021-10-26 22:49:22 1205 4

原创 Vi/Vim基本命令操作

2021年10月22日为什么这么烦,可能是因为今天下雨了,又很冷。我有点抑郁了。多看书多看书,一切都会变得越来越好的。《献给阿尔吉侬的花束》很好看,还没看完,想法好多,看完写个读后感好了。目录目标Vim介绍相关命令设置Vim的工作环境进入插入模式(命令模式下)移动光标(命令模式下)查找和替换(命令模式下)存盘和退出(命令模式下)复制粘贴与删除(命令模式下)编辑命令(命令模式下)多文件编辑(命令模式下)总结目标1.Vim的三种工作模式2.Vim的基本命令Vim介绍Vim由荷兰Bram Moole

2021-10-22 18:33:23 224 2

原创 Linux系统概况

Linux基础学习笔记1文章目录Linux基础学习笔记1目标一、Linux的诞生二、Linux成长的五大基石1. UNIX(UNiplexed Information and Computing System)2. MINIX(mini-UNIX)3. GNU项目(GNU's not UNIX)4. POSIX标准 (Potable Operating System Interface)5. Internet三、内核版本与发行版内核版本Linux发行版开源协议开源社区说明目标Linux相关背景知

2021-10-20 23:27:45 265 2

原创 Mobaxterm远程连接VisualBox上Linux系统,ssh配置

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar

2021-10-19 15:59:59 498

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除