自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 pandas numpy

列表和array模块,是python自带的。Numpy两种基本对象:ndarrayufuncndarray对象修改数组的shape属性,在保持数组元素个数不变的情况下,改变数组每个轴的长度。只是改变每个轴的大小,数组元素在内存中的位置并没有改变。当设置某个轴的元素个数为-1时,将自动计算此轴的长度。第0轴指的是有几行。数值类型与数值对象创建ndarray对象np.array()np.arange(开始值,终值,步长),不包含终值np.linspace(开始值,终值,元数个数),创建

2021-04-18 18:33:33 179

原创 操作系统知识

1. 进程管理,实质上是对处理机的执行“时间”进行管理,采用多道程序等技术将CPU的时间合理地分配给每个任务。2. 存储管理,是对主存储器“空间”进行管理。3. 设备管理,实质是对硬件设备的管理,包括对输入/输出设备的分配、启动、完成和回收。4. 文件管理,主要包括文件存储空间管理、目录管理、文件的读/写管理和存取控制。5. 作业管理,包括任务、界面管理、人机交互、图形界面、语音控制和虚拟现实等。进程管理进程是资源分配和独立运行的基本单位。进程是程序的一次执行。进程通常由程序...

2020-10-29 06:08:42 1092

原创 关系数据库

关系模式R(U,D,dom,F)R(U,D,dom,F)R(U,D,dom,F)

2020-08-23 11:33:56 206

原创 pyecharts jscode

无法将 pyecharts 中的 JSCode 类型的数据转换成 json 数据格式返回到前端页面中使用

2020-07-06 17:05:55 1037

原创 元组演算 数据库

在一个公式中的一个元组变量前有全称量词∀\forall∀或存在量词∃\exists∃符号,则称该变量为约束变量,否则称之为自由变量。原子公式是公式如果φ1\varphi_1φ1​和φ2\varphi_2φ2​是公式,那么,¬φ1,φ1∨φ2,φ1∧φ2,φ1  ⟹  φ2\neg\varphi_1,\varphi_1 \lor \varphi_2,\varphi_1 \land \varphi_2,\varphi_1 \implies \varphi_2¬φ1​,φ1​∨φ2​,φ1​∧φ2​,φ1​

2020-07-04 09:32:42 321

原创 主成分分析 PCA

给定向量组A:a1,a2,⋯ ,amA:a_1,a_2,\cdots,a_mA:a1​,a2​,⋯,am​,如果存在不全为零的数k1,k2,⋯ ,kmk_1,k_2,\cdots,k_mk1​,k2​,⋯,km​,使k1a1+k2a2+⋯+kmam=0k_1a_1+k_2a_2+\cdots+k_ma_m=0k1​a1​+k2​a2​+⋯+km​am​=0则称向量组AAA是线性相关的,否则称它线性无关。几何意义:2个向量是共线,3个向量是共面。给定向量组A:a1,a2,⋯ ,amA:a_1,a_2,\c

2020-07-03 20:50:43 134

原创 方差分析 Analysis of Variance ANOVA 变异数分析 F检验

方差分析 Analysis of Variance ,简称ANOVA,又称变异数分析,FFF检验。用于两个及两个以上样本均数差别的显著性检验。由于各种因素影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一个是不可控的随机因素,另一个是研究中施加的对结果形成影响的可控因素。方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。三大分布自由度χ2\chi^2χ2分布设独立随机变量X1,X2,⋯ ,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn

2020-07-03 20:17:27 1807

原创 微积分

如果lim⁡x→af(x)=f(a)\lim\limits_{x \rightarrow a}f(x)=f(a)x→alim​f(x)=f(a),函数fff在点x=ax=ax=a处连续如果函数在其定义域中的所有的点都连续,就说它是连续的。如果一个函数fff在xxx上可导,那么它在xxx上连续存在不可导的连续函数介值定理如果fff在[a,b][a,b][a,b]上连续,并且f(a)<0f(a)<0f(a)<0且f(b)>0f(b)>0f(b)>0,那么在区间(a,

2020-07-02 21:03:12 293

原创 数据表示和检验 原码、反码、补码、移码表示法

各种数值在计算机中表示的形式称为机器数,其特点是采用二进制计数制,数的符号用0、1表示,小数点则隐含表示不占位置。机器数对应的实际数值称为数的真值。机器数有无符号数和带符号数之分。无符号数表示正数,在机器数中没有符号位。对于无符号位数,若约定小数点的位置在机器数的最低位之后,则是纯整数;若约定小数点的位置在机器数的最高位之前,则是纯小数。对于带符号数,机器数的最高位是表示正、负的符号位,其余位则表示数值。若约定小数点的位置在机器数的最低数值位之后,则是纯正数;若约定小数点的位置在机器数的最高位之前(符号位

2020-06-17 11:18:10 677

原创 导数

导数的应用若一阶导数大于0,则单调递增;若一阶导数小于0,则单调递减;导数等于零的点为函数的驻点若二阶导数大于0,则曲线是凹的;若二阶导数小于0,则曲线是凸的。曲线上凹凸性改变的点为曲线的拐点如果函数的导函数在某一个区间内恒大与零(或恒小于零),那么函数在这个区间单调递增(或单调递减),这种区间就叫做单调区间;如果函数的二阶导函数在某一个区间内恒大于零(或恒小于零),那么曲线在这个区间是凹...

2019-11-01 20:01:20 3905

原创 机器算法过程

数据的加载数据的清洗数据的分割数据的特征工程算法对象构建算法模型训练算法模型效果评估数据的特征工程异常数据的处理数据不平衡处理文本处理:词袋法、TF-IDF多项式扩展、哑编码、标准化、归一化、区间缩放法、PCA、特征选择将均值、方差、协方差等信息作为特征属性,对特征属性进行对数转换、指数转换结合业务衍生出一些新的特征属性数据的清洗清洗异常样本数据:处理格式或...

2019-11-01 20:00:55 155

原创 导数

向量的导数AAA为m×nm \times nm×n的矩阵,xxx为n×1n \times 1n×1的列向量,则AxAxAx为m×1m \times 1m×1的列向量,记作y⃗=A⋅x⃗\vec y = A \cdot \vec xy​=A⋅xA=[a11a12⋯a1na21a22⋯a2n⋮⋮⋮⋮am1am2⋯amn] x⃗=[x1x2⋮xn] y⃗=A⋅x⃗=[a11x1+...

2019-11-01 20:00:38 377

原创 SVD PCA 因子分析

LLE MDS FastMap ISOMAP

2019-11-01 20:00:15 218

原创 spss 一元回归 因子分析

一元回归用一个变量的变化来预测另一个变量(连续变量)的变化,需要进行回归分析一元线性回归:y=a+bx+ey=a+bx+ey=a+bx+e判断自变量是否与因变量之间存在显著相关,以及整个方程的回归效果,必须依据回归分析输出的三个指标得到结论:方差分析,方差分析中的F检验用于检验回归模型与数据的拟合程度。如果F值很大,其显著性水平小于0.05或0.01,表明回归方程是有意义的回归系数显著...

2019-11-01 20:00:00 2039

原创 线性方程组 特征向量 奇异矩阵 可对角化矩阵

{a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋮am1x1+am2x2+⋯+amnxn=bm\left\{\begin{array}{c}a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1 \\a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2 \\\vdots \\a_{m1}x_...

2019-11-01 19:59:39 1574

原创 F检验

其通常是用来分析用了超过一个参数的统计模型,以判断该模型中的全部或一部分参数是否适合用来估计母体。

2019-11-01 19:59:20 12795

原创 卡方检验

t分布比较均值单样本T检验设计思想:单样本T检验的设计模式如下:已知一个总体B,现在在一个未知的总体A中随机抽取了一个已知的样本C,而所问的问题是,总体A与总体B之间有无差异?总体方差未知,关于均值的检验设样本x1,x2,⋯ ,xn1x_1,x_2,\cdots,x_{n_1}x1​,x2​,⋯,xn1​​来自正态总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2),且总体方...

2019-11-01 19:59:03 469

原创 T检验

单总体检验:当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布设总体共有N个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有NnN^nNn种抽法,即可以组成 NnN^nNn不同的样本,在不重复抽样时,共有CNnC_N^nCNn​个可能的样本。每一个样本都可以计算出一个均值,这些所有可能的抽样均值形成的分布就是样本均值的分布。但现实中...

2019-11-01 19:58:42 1073

原创 方差分析 卡方检验 假设检验 Pandas

方差分析在研究一个(或多个)分类型自变量与一个数值型因变量之间的关系时,方差分析就是其中主要方法之一。如果在数据分析过程中,遇到的分类变量有多个,且每一分类变量对应的因变量的值形成的多个总体分布都服从于正态分布,并且各个总体的方差相等,那么比较各个总体均值是否一致的问题可以用方差分析来解决。表面上看,方差分析是检验多个总体均值是否相等的统计分析方法,但本质上它所研究的是分类型自变量对数值型因...

2019-11-01 19:58:26 3668

原创 参数估计

正态分布X~N(μ,σ2)X\text{\textasciitilde} N(\mu,\sigma^2)X~N(μ,σ2)X−uσ~(0,1)\frac{X-u}{\sigma} \text{\textasciitilde} (0,1)σX−u​~(0,1)如果总体服从正态分布,则样本均值的抽样分布都服从正态分布ttt分布假设XXX服从标准正态分布,YYY服从χ2(n)\chi ^2(n...

2019-11-01 19:58:05 394

原创 抽样分布

卡方分布(χ2分布)设 X1,X2,......XnX_1,X_2,......X_nX1​,X2​,......Xn​相互独立, 都服从标准正态分布N(0,1), 则称随机变量χ2=X12+X22+......+Xn2χ^2=X_1^2+X_2^2+......+X_n^2χ2=X12​+X22​+......+Xn2​所服从的分布为自由度为 n 的χ2分布.t分布设X1X_1X1​服从标...

2019-11-01 19:57:44 341

原创 Dataframe 下标存取

方法说明[col_label]以单个标签作为下标,获取与标签对应的列,返回Series对象[col_labels]以标签列表作为下标,获取对应的多个列,返回DataFrame对象[row_slice]整数切片或标签切片,得到指定范围内的行[row_bool_array]选择布尔数组中的True对应的行.get(col_label,default)...

2019-11-01 19:57:22 2275

原创 KNN

K近邻 K-nearst neighbors KNNKNN是一种基本的机器学习算法,所谓K近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻居来代表KNN在做回归和分类的主要区别在于最后做预测的时候的决策方式不同KNN在分类预测时,一般采用多数表决法KNN在回归预测时,一般采用平均值法KNN算法原理从训练集合中获取K个离待预测样本距离最近的样本数据根据获取得到的...

2019-11-01 19:57:07 487 1

原创 特征工程

特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模型准确性热编码 one-hot编码TF-IDFTF-IDF的主要思想是:如果某个词语或短语在一篇文章中出现概率高,并且在其它文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TF-IDF作用:用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度IF:词的频率,该...

2019-11-01 19:56:51 104

原创 PCA

协方差矩阵协方差矩阵的每个元素是各个向量元素之间的协方差协方差矩阵为对称非负定矩阵数学期望期望(mean):也就是均值,是概率加权下的“平均值”,是每次可能结果的概率乘以其结果的总和,反映的是随机变量平均取值大小。连续性E(X)=∫−∞∞xf(x)dxE(X)=\int_{-\infin}^\infin xf(x)dxE(X)=∫−∞∞​xf(x)dx离散型E(X)=∑ixipiE(X...

2019-11-01 19:56:09 165

原创 矩阵

矩阵:即描述线性代数中线性关系的参数,即矩阵是一个线性变换,可以将一些向量转换为另一些向量初等代数中,y=ax表示的是x到y的一种线性映射关系,其中a是描述这中关系的参数。线性代数中,Y=AX表示的也是向量X和Y的一种线性映射关系,其中A是描述这种关系的参数。当m=1或者n=1的时候,称A为行向量或者列向量设A是数域上的一个n阶方阵,若在相同的数域上存在另一个n阶方阵B,使得AB=BA=E...

2019-11-01 19:55:43 750

原创 数值数据编码

原码,最高位是符号位,0表示正号,1表示负号,反码,最高位是符号位,0表示正号,1表示负号,正数的反码与原码相同,负数的反码则是其绝对值按位求反补码,最高位是符号位,0表示正号,1表示负号,正数的补码与其原码和反码相同,负数的补码则等于其反码的末尾加1...

2019-11-01 19:55:20 328

原创 概率论的基本概念

从mmm个不同元素中取出n(n≤m)n(n\leq m)n(n≤m)个元素(被取出的元素各不相同),并按照一定的顺序排成一列(一般顺序是抽取出来的顺序),叫做从mmm个不同元素中取出nnn个元素的一个排列,记作A(m,n)A(m,n)A(m,n)A(m,n)=Amn=m!(m−n)!A(m,n)=A_m^n=\frac{m!}{(m-n)!}A(m,n)=Amn​=(m−n)!m!​从mmm个...

2019-11-01 19:54:53 321

原创 Machine Learning

机器算法

2019-11-01 19:54:25 126

原创 假设检验

统计上对参数的假设,就是对一个或多个参数的论述。而其中欲检验其正确性的为零假设(null hypothesis),零假设通常由研究者决定,反映研究者对未知参数的看法。相对于零假设的其他有关参数之论述是备择假设(alternative hypothesis),它通常反映了执行检定的研究者对参数可能数值的另一种(对立的)看法(换句话说,备择假设通常才是研究者最想知道的)。t检验T检验,亦称st...

2019-10-23 17:29:08 273

原创 线性代数2

向量可以平移,向量模长与方向确定也不唯一向量使矢量,既有大小又有方向数量积:a⃗⋅b⃗=∣a⃗∣∗∣b⃗∣∗cosθa⃗⋅b⃗=x1y1+x2y2+⋯+xnyn\vec a \cdot \vec b = |\vec a|*|\vec b|*cos\theta \\\vec a \cdot \vec b=x_1y_1 + x_2y_2 + \cdots + x_ny_na⋅b=∣a∣∗∣b...

2019-10-22 20:40:03 147

原创 数学基础

函数:定义域、值域、对应的映射法则函数的几种特性:有界性、单调性、周期性、奇偶性反函数:逆映射;函数与其反函数关于直线y=xy=xy=x对称;若函数是单调函数,则其反函数存在,且反函数也是单调函数,且单调性相同复合函数极限:数列极限、函数极限极限准则:夹逼准则;单调有界数列必有极限两个重要极限:lim⁡x→0sinxx=1\lim\limits_{x\rightarrow 0}\...

2019-10-22 20:39:40 333

原创 正则表达式 python

python 提供Perl风格的正则表达式模式compile函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换match函数从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,返回的是None;匹配成功的话返回一个匹配对象re.match(pattern,string,flags=0)pattern,匹配的正则表达式st...

2019-10-22 20:39:06 74

原创 线性回归

dga

2019-10-11 09:35:29 152

原创 机器算法

线性回归最近邻算法 KNNK-Means k平均算法决策树随机深林朴素贝叶斯逻辑回归 Logistic 回归支持向量机(SVM)主成分分析(Principal Component Analysis,PCA)奇异值分解(Singular Value Decomposition,SVD)...

2019-10-11 09:34:56 116

原创 SQL SERVER 配置管理器

SQL Server 2012 为 SQLServerManager11.msc

2019-10-04 21:20:47 926

原创 pandas Excel隐藏表

当pandas.read_excel用索引的方式读取EXCEL时,隐藏的sheet依然可以用索引的方式读取出来

2019-09-30 15:22:21 1228

原创 dataframes count()函数忽略缺失值

dataframes count()函数忽略缺失值

2019-09-30 15:15:37 683

原创 mysql python charset 是utf8 而不是utf-8

mysql python charset 是utf8 而不是utf-8

2019-09-30 15:12:53 633

原创 Excel 单元格的值确定是数值格式,但是却靠左边显示

这时候,一般检查显示公式的按钮是否打开了

2019-09-30 14:51:56 2039

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除