Data学习中的Monster-CSDN博客

原创 python-Numpy基础：线性代数

线性代数Numpy 定义了 matrix 类型，使用该 matrix 类型创建的是矩阵对象，它们的加减乘除运算缺省采用矩阵方式计算，因此用法和Matlab十分类似。但是由于 NumPy 中同时存在 ndarray 和 matrix对象，因此用户很容易将两者弄混。这有违 Python 的“显式优于隐式”的原则，因此官方并不推荐在程序中使用 matrix 。在这里，我们仍然用 ndarray 来介绍。矩阵和向量积矩阵的定义、矩阵的加法、矩阵的数乘、矩阵的转置与二维数组完全一致，不再进行说明，但矩阵的乘法有

2020-11-29 22:07:19 265

原创 python-Numpy: 统计相关

统计相关次序统计计算最小值numpy.amin(a[, axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue,where=np._NoValue])Return the minimum of an array or minimum along an axis.# 【例】计算最小值import numpy as npx = np.array( [[11, 12, 13, 14, 15],

2020-11-27 19:58:55 162

原创 Python：NumPy-随机抽样

随机抽样本文程序可直接运行，但图片导入有点问题；numpy.random 模块对 Python 内置的 random 进行了补充，增加了一些用于高效生成多种概率分布的样本值的函数，如正态分布、泊松分布等。numpy.random.seed(seed=None) Seed the generator.seed() 用于指定随机数生成时所用算法开始的整数值，如果使用相同的seed() 值，则每次生成的随机数都相同，如果不设置这个值，则系统根据时间来自己选择这个值，此时每次生成的随机数因时间

2020-11-25 22:43:07 1902

原创 Python-NumPy学习：输入输出

输入输出numpy 二进制文件save() 、savez() 和load() 函数以 numpy 专用的二进制类型**（npy、npz）保存和读取数据，这三个函数会自动处理ndim、dtype、shape等信息，使用它们读写数组非常方便，但是save() 输出的文件很难与其它语言编写的程序兼容**。-npy格式：以二进制的方式存储文件，在二进制文件第一行以文本形式保存了数据的元信息（ndim，dtype，shape等），可以用二进制工具查看内容。-npz格式：以压缩打包的方式存储文件，可以用压缩软件

2020-11-23 10:46:49 605 1

原创离散型概率分布

补充知识——wikipedia伯努利试验：是只有两种可能结果（成功或失败）的单次随机试验，即对于一个随机变量X而言：P(X=1)=pP(X=1)=pP(X=1)=pP(X=0)=1−pP(X=0)=1-pP(X=0)=1−p伯努利过程：是一系列独立同分布的伯努利试验，每个XiX_iXi的2个结果也被称为“成功”或“失败”。是一个由有限个或无限个的独立随机变量 $X_1, X_2, X_3 ,… $所组成的离散时间随机过程，其中 $X_1, X_2, X_3 ,… $满足如下条件

2020-05-13 16:37:23 2654

原创分布相关函数

概率质量函数probability mass function，简称PMF；是离散随机变量X在各特定取值上的概率P(x)，其总和为1。与概率密度函数f(x)不同，概率质量函数是对离散随机变量定义的，本身就代表该值的概率。离散随机变量概率质量函数的不连续性决定了其累积分布函数也不连续。概率密度函数是对连续随机变量定义的，本身不是概率，它在某区间内的积分才是概率。图中，横轴为随机变量的取值，纵轴为概率密度函数的值，而随机变量的取值落在某个区域内的概率为概率密度函数在这个区域上的积分。

2020-05-13 16:31:45 258

原创贝叶斯定理

贝叶斯定理@(DataAnalysis)[贝叶斯法则，贝叶斯定理]文章目录贝叶斯定理产生来源补充知识深入理解应用案例案例一：事件判断案例一：疾病检验案例二：垃圾邮件过滤器案例三：机器学习之贝叶斯算法产生来源引入：在贝叶斯创造这个理论之前，人们已经能够计算出正向概率，如：“假设某个袋子中有N个白球，M个黑球，摸出黑球的概率是多大？”，当然这是在已知数据的情况下才能计算的先验概率。这个问题反过来：“如果我们事先并不知道袋子里面是什么球，而摸出一个（或者几个）球，观察球的颜色之后来推测袋子中球的比例”

2020-05-12 15:19:16 1377

原创 python类

数据分析python基础学习类（class）：定义：类是某一批对象的抽象，可以理解成某种概念。例如：str/list/dict/tuple均为一个类。语法：class 类名：执行语句…零个到多个类变量…零个到多个方法…成员：类变量和方法；如果不定义任何类变量和方法，这个类就相当于空类，可以使用pass语句作为占位符；成员之间定义顺序没有任何影响，可以相互调用；...

2020-02-27 19:21:20 195

原创 python常用函数

常用函数一、字符函数1. strip / lstrip / rstrip描述：lstrip：去除（字符串）左边（开始）的rstrip：去除（字符串）右边（末尾）的strip：去除（字符串的）左边的和右边的注：默认去除空格返回值返回字符串实例：str1 = " hello world! "print (str1.rstrip())str2 = " hello w...

2020-02-27 10:43:14 1743

原创正则化(regularization)

正则化定义为了防止过拟合，进而增强泛化能力（泛化误差=测试误差：generalization error=test error）。是一种为了减小测试误差的行为（有时候会增加训练误差）。我们在构造模型（机器学习模型等）时，最终目的是让模型在面对新数据的时候可以有很好的表现。当你用比较复杂的模型（比如神经网络）去拟合数据是，很容易出现过拟合现象，这会导致模型的泛化能力下降，这时候，就需要使用正则...

2020-02-26 11:10:22 346

原创损失函数（Loss Function）

损失函数（Loss Function）：1. 定义：如下是几种关于损失函数的定义：用来表现预测与实际数据的差距程度用来估计模型的预测值f(x)与真实值Y的不一致程度，是一个非负实值函数，通常用L(Y,f(x))来表示。损失函数越小，模型的鲁棒性（robustness：抗变换性）越好机器学习中所有算法都需要最大化或者最小化一个函数（目标函数）。所以一般就把最小化的一类函数，称为“损失函数”...

2020-02-26 11:00:52 2868

qq_45089354的博客