自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 问答 (2)
  • 收藏
  • 关注

原创 样本方差为什么除(n-1)?验证一下那个更准确

实际上,样本方差可以理解成是对所给总体方差的一个无偏估计。n-1的使用称为贝塞尔校正(Bessel's correction),也用于样本协方差和样本标准偏差(方差平方根)。 平方根是一个凹函数,因此引入负偏差(由Jensen不等式),这取决于分布,因此校正样本标准偏差(使用贝塞尔校正)有偏差。用python随机生成一个一百万数据的总体,然后进行1000次抽样,每次抽50个数据。1.先导入需要用到的包import pandas as pd import numpy as npimpor

2022-05-26 18:38:56 399

原创 MYSQL窗口函数,数据分析好轻松

可分为两大类:专用窗口函数、常用聚合函数专用窗口函数ROW_NUMBER() OVER(PARTITION BY …ORDER BY …)当前行在组内的序号,不管是否出现重复项,不间断连续排序号,如1,2,3,4,5......DENSE_RANK() OVER(PARTITION BY …ORDER BY …)不间断组内排序,重复项序号会相同,如1,1,2,2,3......RANK() OVER(PARTITION BY …ORDER BY …)间断组内排序,重复项序

2022-05-25 13:36:29 256

原创 Error: cannot import name ‘delayed‘ from ‘sklearn.utils.fixes‘

问题:调用 from imblearn.over_sampling import SMOTE 出现报错报错:cannot import name ‘delayed‘ from ‘sklearn.utils.fixes‘首先:依赖库要求:imblearn需要依赖某些Python模块(下面是最新版0.7.0的依赖要求)python (>=3.6)numpy (>=1.13.3)scipy (>=0.19.1)scikit-learn (>=0.23)keras 2

2022-04-10 18:21:44 3190

原创 jupyter 主题设置与jupyter常用插件

jupyter 默认的主题我实在是用的很不习惯,所以我安装完成第一件事就是换一个心仪的主题。我们可以通过命令行窗口或 Anaconda Prompt 窗口安装 jupyter 主题pip install jupyterthemes

2022-03-12 22:20:27 1395

原创 手搓函数,实现train_test_split一样的数据集划分

在机器学习训练算法模型之前,我们一般都需要对数据集进行划分为训练集和测试集。训练集用作机器学习训练得出算法模型,而测试集用来对训练出来的模型进行检验。在sklearn中可以从sklearn.model selection中调用train_test_split函数方法实现数据集的划分。1、train_test_split今天我们来手搓一个函数实现train_test_split一样的数据集划分。话不多说,我们直接先上代码!from random import randrangefro.

2022-03-04 17:28:39 1599

原创 自写函数实现特征预处理之标准化

标准化是一个常用的数据预处理操作,目的是处理不同规模和量纲的数据,使其缩放到相同的数据区间和范围,以减少规模、特征、分布差异等对模型的影响。标准化数据通过减去均值然后除以方差(或标准差),这种数据标准化方法经过处理后数据符合标准正态分布,即均值为0,标准差为1,转化公式:通过函数要怎么实现呢?公式较为复杂我们可以采取拆分的方法逐一完成。1、先计算平均值 data = [[5, 6, 3], [4, 6, 8], [6, 9, 7]]def data_mean(data):

2022-02-26 23:48:34 403

原创 不用pandas,自写数据读取函数

不用pandas,自写数据读取函数

2022-02-26 15:21:39 1001

原创 朋友还没看完一本novel,我已经快要搬完书库了

利用scrapy获取小说详情页信息

2022-01-23 11:00:02 90

转载 Linux常用命令大全 @ 超级全

都是常用的Linux命令,超级全!!

2021-12-06 16:58:53 141

原创 MYSQL的一些实用函数

可能业务不同使用的频率不高,但是需要的时候还是很实用哒

2021-09-10 17:14:07 122

原创 SaaS常用指标及计算方法

一、常用指标1、MRR/ARR(M:month,A:year)RR:经常性收入(Recurring Revenue)是未来持续可获得的收入,SaaS 而言,经常性收入来自客户的订阅,具有稳定、可预测、高度确定的特点。主要按月合同及少量的年度合同,采用 MRR(Month Recurring Revenue 月度经常性收入)。MRR 用于衡量每月订阅收入,如果有一些年度订阅,除以 12,再分摊到每月来计算 MRR 按年合同及少量的多年合同 ,采用 ARR(Annual Recurring Rev

2021-08-24 18:28:48 3062

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除