自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Pearson&Spearman&Kendall相关系数及Python实现

Pearson/Spearman/Kendall相关系数Pearson相关系数概述:皮尔森相关系数也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数,是最常用的一种相关系数。记为r,用来反映两个变量X和Y的线性相关程度,r值介于-1到1之间,绝对值越大表明相关性越强。定义:其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差性质:不相关和独立:皮尔森距离:皮尔

2021-03-11 17:16:00 3435

原创 数据埋点

数据埋点数据科学中的数据从哪里来?•主动收集(爬虫)•被动收集(埋点)埋点是数据采集的一种方式,数据采集是数据分析的起点,今天我们就来聊聊埋点1,埋点1.1 什么是埋点?一种非常传统、非常普遍的方式就是通过写代码去定义这个事件。在网站需要监测用户行为数据的地方加载一段代码,比如说注册按钮、下单按钮等。加载了监测代码,我们才能知道用户是否点击了注册按钮、用户下了什么订单。所有这些通过写代码来详细描述事件和属性的方式,国内都统称为“埋点”。这是一种非常耗费人力的工程,并且过程非常繁琐重复,但是

2021-02-24 17:46:14 321

原创 评估用户标签的质量

评估用户标签的质量为什么要评估标签质量首先,为什么要进行标签质量评估?想象一下,我们开发了一个“用户年龄”标签,业务想针对20-30岁的人进行精准投放。但经过筛选,才筛出来几千个人,和公司总体用户相比仅仅是九牛一毛,那这样的标签,还有价值不?因此,对标签的质量进行科学完整地评估,有助于指导标签的管理者、开发者不断地提升标签质量。通过创建一套完整的评估体系,对于质量过差的标签,不着急上线,等达到基本的质量要求后再开放给业务使用。不然,既对业务带来不了价值,也容易让标签画像系统失去用户的信任。回过头,

2021-02-24 17:22:45 636

原创 superset_windows\centOS7安装

#window10安装conda install -c conda-forge python-geohash -yconda install -c conda-forge openssl==1.1.1d -ypip install apache-superset -i https://pypi.douban.com/simpleset FLASK_APP=supersetflask fab create-adminsuperset db upgradesuperset load-

2021-02-21 17:29:32 160

原创 python-selenium模拟登陆(滑动验证码)

python-selenium模拟登陆(滑动验证码)普通滑动验证码验证只需要我们将滑块拖动指定位置,处理起来比较简单。拖动之前需要先将滚动条滚动到指定元素位置,但是需要注意目标网站对selenium的反爬,如window.navigator.webdriver识别;滑块移动速度识别等;带缺口(拼图)滑动验证码这一类验证码可以使用两种方式识别:①在目标网站带有完整背景图时,可以获取完整背景图与带缺口的图片进行比较,获取缺口的位置,计算距离,拖动滑块移动至缺口即可;②尝试先用cv2的边缘检测识别出

2021-02-21 17:18:38 2908

原创 linux部分文件操作命令

常用基本命令1.命令常用方法Linux命令格式: command [-options] [parameter1] …说明:command: 命令名,相应功能的英文单词或单词的缩写 [-options]:选项,可用来对命令进行控制,也可以省略,[]代表可选 parameter1 …:传给命令的参数:可以是零个一个或多个例如:ls -a ./2.查看帮助文档1>...

2019-08-11 16:45:41 301

原创 Linux简介与安装

一、Linux系统简介1.Linux发展史1946年世界上的第一台计算机就产生了,刚产生出的计算机并没有操作系统,需要手工输入人机矛盾:1. 只能一个人使用 2.人工速度慢于计算产生操作系统(根据人的需求产生)1965年麻省理工,ATT,贝尔实验室去研发一套操作系统,想要允许300台操作并使用1969年实现进度缓慢,计划失败了1969-1970 肯.汤姆逊移植了一个软件,定制一套标...

2019-08-11 16:42:59 148

原创 python内存管理

每一种语言都有自身的一个内存管理机制,那么在python中是如何进行内存管理的?总所周知,python是一种动态数据类型的语言,在就是说,在python中变量无须事先声明、变量无需指定类型,我们甚至无需关心它的内存管理,那么,python是如何做到如此智能的,内存资源它是如何回收的?我们可以从这三个方面说起:一、python的内存管理机制----引用计数在python内部我们通过引用计数来...

2019-08-01 21:33:14 75

原创 python字符串的介绍

创建字符串str1 = “hello”str2 = ‘hello’字符串的运算:字符串的拼接:1.使用"+“号str3 = str1+str22、使用”,"号注意:在输出的时候使用,在逗号的位置会产生一个空格3.使用%号%s字符串4.使用join函数来进行拼接str1.join(序列)功能:以指定的字符串对序列中的元素进行拼接,并且返回拼接后的字符串注意:序列中的元素必...

2019-07-30 21:21:34 185

原创 python基础之字符串函数

eval(str):将字符串转为有效的表达式并且将表达式结果返回.str(obj):将其他类型的转为字符串string.upper():将小写转为大写字母string.swapcase():将大写转为小写,小写转为大写string.title():将字符串标题化str.capitalize():将开头的首字母大写,其他小写string.center(width,fillchsr):返回...

2019-07-21 13:39:41 104

原创 pygame应用之自动获取MP3歌曲时长以及播放

首先介绍一下关于pygame模块.Pygame是被设计用来写游戏的python模块集合,Pygame是在优秀的SDL库之上开发的功能性包。使用python可以导入pygame来开发具有全部特性的游戏和多媒体软件,Pygame是极度轻便的并且可以运行在几乎所有的平台和操作系统上。Pygame包已经被下载过成千上万次,并且也被访问过成千上万次。简单来说pygame这个模块就是用来处理音频以及图像的...

2019-07-21 12:50:15 3664 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除