自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 groupby 的妙用(注意size和count)

https://www.cnblogs.com/zknublx/p/12048410.html

2021-04-02 10:31:22 360

原创 [机器学习]模型评估指标:ROC/AUC,KS,GINI,Lift/Gain, PSI 总结

目录背景介绍一 ROC曲线和AUC值二 KS曲线三 GINI系数四 Lift , Gain五 模型稳定度指标PSI背景介绍在模型建立之后,必须对模型的效果进行评估,因为数据挖掘是一个探索的过程,评估-优化是一个永恒的过程。在分类模型评估中,最常用的两种评估标准就是KS值和GINI, AUC值.可能有人会问了,为什么不直接看正确率呢?你可以这么想,如果一批样本中,正样本占到90%,负样本只占10%,那么我即使模型什么也不做,把样本全部判定为正,也能有90%的正确率咯?所以,用AUC值够保证你在

2021-03-19 16:47:27 10203 3

原创 ModuleNotFoundError: No module named 'xxx'; 'xxx' is not a package

ModuleNotFoundError: No module named ‘xxx’; ‘xxx’ is not a package错误:  ModuleNotFoundError: No module named ‘xxx’; ‘xxx’ is not a package通过pycharm对脚本进行debug时,出现了如下错:  ModuleNotFoundError: No modul...

2020-05-03 23:13:21 724 1

原创 python利用twilio模块给自己发短信

1.访问http://twilio.com/并填写注册表单。注册了新账户后,你需要验证一个手机号码,短信将发给该号码。2.Twilio 提供的试用账户包括一个电话号码,它将作为短信的发送者。你将需要两个信息:你的账户SID 和AUTH(认证)标志。在登录Twilio 账户时,可以在Dashboard 页面上找到这些信息。从Python 程序登录时,这些值将作为你的Twilio用户名和密码...

2020-05-03 22:16:15 219

原创 pip安装python包出错:Could not find a version that satisfies the requirement skimage (from versions: )

2020-05-03 22:02:56 761

原创 python3安装pyzmail出错

python3安装pyzmail出错python3 ,利用pip install pyzmail 出现错误如下:AttributeError: module ‘importlib._bootstrap’ has no attribute ‘SourceFileLoader’解决方案:尝试下pip install pyzmail36...

2020-05-03 16:02:09 856

原创 数据挖掘

数据挖掘其实是一种深层次的数据分析方法。数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。应用的技术包括:数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面。数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所...

2019-09-24 23:26:44 502

转载 AARRR模型

参考:https://blog.csdn.net/aa3236925/article/details/79012756AARRR模型定义  AARRR是Acquisition、Activation、Retention、Revenue、Refer,这个五个单词的缩写,分别对应用户生 命周期中的5个重要环节:获取用户、提高用户活跃度、提高用户留存率、获取收入、自传播。    AARRR模型,通...

2019-09-04 11:03:36 682 1

原创 常见排序算法及对应的时间复杂度和空间复杂度

排序算法经过了很长时间的演变,产生了很多种不同的方法。对于初学者来说,对它们进行整理便于理解记忆显得很重要。每种算法都有它特定的使用场合,很难通用。因此,我们很有必要对所有常见的排序算法进行归纳。排序大的分类可以分为两种:内排序和外排序。在排序过程中,全部记录存放在内存,则称为内排序,如果排序过程中需要使用外存,则称为外排序。下面讲的排序都是属于内排序。内排序有可以分为以下几类:(1)、插入...

2019-09-01 22:50:36 767

原创 python路径拼接os.path.join()函数完全教程

os.path.join()函数用于路径拼接文件路径。os.path.join()函数中可以传入多个路径:只有一个以”/”开头的参数时,会从第一个以”/”开头的参数开始拼接,之前的参数全部丢弃。当有多个”/”开头的参数时,从最后”/”开头的的开始往后拼接,之前的参数全部丢弃。以上一种情况为先。在上一种情况确保情况下,若出现”./”开头的参数,”./” 前的全部会保留的。参数之间自动添加“\...

2019-08-26 17:52:38 1361

原创 python中[-1]、[:-1]、[::-1]、[n::-1]使用方法

b=a[i:j] 表示:从位置i到位置j之前的数,包括a[i],不包括a[j] 当i缺省时,默认为0,即 a[:3]相当于 a[0:3] 当j缺省时,默认为len(a), 即a[1:]相当于a[1:len(a)]b = a[i:j:s] 表示:从位置i到位置j之前的数,包括a[i],不包括a[j], 其中s表示步长,缺省为1,所以a...

2019-08-20 22:58:07 322

原创 360 2018年春招编程题第三题

t = int(input())list1=[]#for i in range(t): data = list(map(int, input().split())) data.sort() if data[2] <2*(data[0] + data[1]): # 此时 data[0] + data[1] > (data[0] + data[1]...

2019-08-20 17:50:06 216

原创 360 2018年春招编程题第一题

t = int(input())list1=[]#for i in range(t): n = int(input()) num = 0 for j in range(n): data = list(map(int, input().split())) x, y = [data[0], data[2]], [data[1], dat...

2019-08-20 16:45:43 161

原创 Python-count函数

count函数用于统计字符串或列表中某个字符出现的次数。语法为:lis.count(lis1)#lis为列表,lis1为要搜索的列表值str.count("char", start= 0, end=len(string)) 或 str.count("char") #str为字符串,char为要统计的字符(可以是单字符,也可以是多字符),start和end分别为字符串搜索的起始和结束位...

2019-08-20 16:11:44 871

转载 机器学习之SVM介绍

转载至:https://blog.csdn.net/lhy2239705435/article/details/90035265SVM(Support Vector Machine)是用来解决分类问题的。任何一个机器学习问题首先要考虑三个问题:模型是什么优化目标是什么算法是什么一、SVMsupport vector machine,在机器学习中,SVM 既可以做回归,也可以做分...

2019-08-19 20:03:34 276

原创 numpy的 ones_like和 zeros_like 函数

numpy的ones_like函数返回一个用1填充的跟输入数组 形状和类型 一样的数组。同理,zeros_like返回一个用0填充的跟输入数组 形状和类型 一样的数组。

2019-08-18 19:43:41 1464

转载 校招选择题汇总【图形推理(1)】含答案解析

版权声明:本文为CSDN博主「Teacher_HENG」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/u010189239/article/details/89288615本文根据自己的想法对原文部分案例给出自己的答案!不保证对错!案例1答案:C本题所有图形均为左右对称的将左边的一半去掉,剩下的...

2019-08-18 16:32:18 724

转载 面试题:看数字找规律

转载至:https://blog.csdn.net/slj_win/article/details/7204595第一种----等差数列:是指相邻之间的差值相等,整个数字序列依次递增或递减的一组数。1、等差数列的常规公式。设等差数列的首项为a1,公差为d ,则等差数列的通项公式为an=a1+(n-1)d (n为自然数)。[例1]1,3,5,7,9,( ) A.7 B.8 ...

2019-08-17 22:20:46 1111

转载 DBSCAN(具有噪声的基于密度的聚类方法)

DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种很典型的密度聚类算法,和K-Means,BIRCH这些一般只适用于凸样本集的聚类相比,DBSCAN既可以适用于凸样本集,也可以适用于非凸样本集。下面我们就对DBSCAN算法的原理做一个总结。1、 密度聚类原理    DBSCA...

2019-08-04 17:20:38 4756

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除