zsyRain-CSDN博客

原创统计学习方法概述

一，统计学习定义、研究对象与方法二，监督学习三，统计学习方法三要素四，模型选择五，监督学习方法应用一：统计学习定义：关于计算机基础数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科，另称为统计机器学习统计学习的主要特点：1，以计算机网络为平台（建立在计算机及网络之上）2，以数据为研究对象（数据驱动的学科）3，对数据进行预测与分析4，以方法为中心...

2018-09-14 19:31:59 160

原创虚拟机主机固定静态IP，网络ping不通的解决方法

vi /etc/sysconfig/network-scripts/ifcfg-ens33 文件中，2， ping 本机IP 能ping通，但是ping外网就ping不通。添加：HWADDR=00:0C:29:90:D3:6B。1，Centos网卡和MAC地址不匹配启动失败问题。原因是由于dns服务器没有配置导致的问题。网络适配器是否有修改。重启服务器 reboot init6。

2022-11-15 11:29:21 3031 1

原创非root用户安装python nginx mysql

1，安装python3.7wgethttps://www.python.org/ftp/python/3.7.7/Python-3.7.7rc1.tgz

2021-06-09 17:08:39 189 2

原创 linux Docker的Portainer可视化界面

https://blog.csdn.net/u011984312/article/details/85119188

2021-04-30 11:02:03 183

查看centos系统内核版本 uname -ryum包更新到最新 sudo yum update卸载之前版本（如果安装过） sudo yum remove docker docker-common docker-selinux docker-engine安装需要的软件包，yum-util提供yum-config-manager功能，另外是devicemapper驱动依赖的sudo yum install -y yum-utils device-mapper-persiste...

2021-02-03 09:06:24 80

原创 K近邻算法

1，监督学习2，样本的特征用向量表示3，预测数据的特征与已知样本的特征之间计算距离4，选择K个距离最近的样本5，统计待分的类中，K个样本中的各个类别的数量6，K个样本中，类别所占样本数最多的，即该预测数据的类别K值的选取很关键，影响准确性。样本的特征必须为有限的固定值统计特征数量的更适合用k-近邻算法...

2020-12-03 19:11:17 76

原创什么是线性回归分析

变量之间的非严格函数关系变量之间X、Y之间存在某种密切的联系，但并非严格的函数关系（非确定性关系）。回归回归是处理两个或两个以上变量之间互相依赖的定量关系的一种统计方法和技术，变量之间的关系并非确定的函数关系，通过一定的概率分布来描述。线性与非线性线性（Linear）的严格定义是一种映射关系，其映射关系满足可加性和其次性。通俗理解就是两个变量之间存在一次方函数关系，在平...

2019-08-20 19:12:11 2716

原创回归分析

2019-08-20 18:55:56 122

原创方差和偏差

偏差、方差与噪声偏差（Bias）：描述的是根据样本拟合出的模型的输出预测结果的期望与样本真实结果的差距，即在样本上拟合的好不好。方差（Variance）：模型每次输出结果与模型输出期望之间的误差，即模型的稳定性。噪声（Noise）：为真实标记与数据集中的实际标记间的偏差，通常由多种因素综合影响造成，不可去除。偏差度量了学习算法的期望预测与真实结果的偏离程度，刻画了学习算法本身的拟合...

2019-08-20 18:46:24 202

原创比较检验

模型比较选择合适的评估方法和相应的性能度量，计算出性能度量后直接比较。存在以下问题：模型评估得到的是测试集上的性能，并非严格意义上的泛化性能，两者并不完全相同测试集上的性能与样本选取关系很大，不同的划分，测试结果会不同，比较缺乏稳定性很多模型本身有随机性，即使参数和数据集相同，其运行结果也存在差异假设检验统计假设检验（Hypothesis Tset）：事先对总体...

2019-08-20 18:22:49 951

原创模型的性能度量

性能度量（Performance Measure）：评价模型泛化能力的标准。对于不同的模型，有不同的评价标准，不同的评价标准将导致不同的评价结果。模型的好坏是相对的，取决于对于当前任务需求的完成情况。回归模型的性能度量通常选用均方误差（Mean Squared Error）。分类算法常用的性能度量：聚类算法的性能度量：...

2019-08-20 12:33:15 251

原创模型的评估方法

模型的评估方法评估思路：通过实验测试，对模型的泛化误差进行评估，选出泛化误差最小的模型。待测数据集全集未知，使用测试集进行泛化测试，测试误差（Testing Error)即为泛化误差的近似。留出法留出法（Hold-out）：将已知数据集分成两个互斥的部分，其中一部分用来训练模型，另一部分用来测试模型，评估其误差，作为泛化误差的估计。两个数据集的划分要尽可能保持数据...

2019-08-20 11:50:04 825

原创 1.1 如何“玩”算法

“玩”算法三点：1，对遇到的特殊问题要能够自己设计出算法实现2，对于原理公开的知名算法，要能将算法原理翻译成具体的算法代码3，对已有具体实现的算法，要能够设计出合适的数学模型，将算法应用到世纪问题中（需熟练掌握各种常用的基础算法外，还要了解算法设计的常用思想和模式，并要掌握将题目转换成数据模式，进一步用数据结构实现数据模型的一般方法。）数据模型数据模型定义：在计算机程...

2019-05-28 22:11:53 158

转载数据取对数的作用

对数函数在其定义域内是单调递增函数，取对数后不会改变数据的相对关系。数据取对数的作用：1，缩小数据的绝对数值，方便计算。2，取对数后，可以将乘法计算转换成加法计算。3，某些情况下，在数据的整个值域中的，不同区间的差异带的影响不同。例：两组数，500和500，200和800，和为1000。从总和看没差别，若取对数：log500=2.69897，log200=2.30103，...

2018-10-24 18:08:32 18962

zsyRain的博客