- 博客(32)
- 资源 (1)
- 收藏
- 关注
原创 特征工程之距离相关系数( Distance correlation coefficient )
距离相关系数:线性关系可以通过pearson相关系数来描述,单调关系可以通过spearman或者kendall来描述,非线性如何描述,距离相关系数可以非线性相关性。我们都知道,皮尔森关联系数只能描述数据键的线性相关性程度,对于非线性相关数据,皮尔森关联系数显然不适合的,距离相关系数恰恰能在很大程度上客服皮尔森相关系数的弱点。比如:Pearson相关系数等于0,这两个变量并不一定就是独立的(有...
2019-12-17 19:32:37 19827 3
原创 【无标题】
小编给大家分享一下MySQL中“:=”和“=”的区别是什么,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!=只有在set和update时才是和:=一样,赋值的作用,其它都是等于的作用。鉴于此,用变量实现行号时,必须用:=。:=不只在set和update时时赋值的作用,在select也是赋值的作用。下面是:=和=的在select时作用对比sqlset @num = 0;SELECT @num := @num+1 AS
2021-11-21 14:24:04 534
原创 使用cmd运行.py文件时提示(ImportError: DLL load failed: 找不到指定的模块),但是在pyCharm里面运行正常
最近一直在研究使用win10的定时任务功能执行一些.py脚本,在使用的时候需要通过cmd命令行进行执行,在运行有numpy包的.py文件时,提示如下错误:然后我就尝试去掉numpy是否能够正常执行,神奇的是成功了,由于我的程序必须通过numpy包处理一些数据,所以度娘了很多,发现很多人都遇到了这种问题,自己也做一下记录,防止以后忘记了。今天在浏览这个https://www.cnblogs.com/jonins/p/9691826.html这个网址的时候,发现里面介绍在系统环境变量PATH里面加入,如下
2021-01-24 17:04:36 1124
转载 MySQL计算某一个时间段的最大并发量
MySQL group by 统计每5分钟数据量20-10-23 00:01字数 1720阅读 187已编辑需求有打卡记录表结构如下ID user_id (int) create_time (int)1 123 1603209599现需要统计每5分钟的记录数量,按记录数量降序排列分析关键在于怎么把create_time按每5分钟分组,可以使用取模 % 实现举例现有时间戳 1 - 10 秒,每5秒分一组首先对每秒跟5取模,结果如下1 % 5 = 12 % 5 = 23 % 5
2021-01-22 15:28:57 1042
原创 Django将已有数据库表导入项目
python3以后的版本需要安装pymysql,并通过pip/pip3 install mysqlclient一、建立连接打开项目settings.py,配置数据库信息DATABASES = {‘default’: {‘ENGINE’: ‘django.db.backends.mysql’,‘NAME’: ‘数据库名称’,‘USER’:‘root’,‘PASSWORD’:‘root’,‘HOST’:‘数据库地址’,‘PORT’:‘端口’,}}二 同步数据库当中的所有表使用命令:
2021-01-22 11:10:28 1101
原创 数据分析业务问题
一、如何估算今年新生儿出生数量首先,这类估算问题会经常出现在数据分析、产品、咨询类岗位,统称为费米问题。分析这类问题可以 分别从两个角度展开。 根据情况,可以采用 Top down bottom up 法则 ,即 先从宏观层面, 自上而下推,再由某个点横向切入,反推上去。或者也可以从需求层面和供给层面来说。然后可以对比 两次推测得到的结果,如果相差 不悬殊,那基本就没差啦。然后在陈述的时候也可以...
2020-02-22 22:25:59 1466
原创 岭回归算法
岭回归算法简介回归算法的本质上就是为了解决一个线性方程:Ax = b标准估计方法是普通的最小二法的线性回归,然而如果x是一个病态的矩阵,在这种情况下使用普通最小二法估计会导致过拟合或者欠拟合的情况。此外,岭回归还可以处理矩阵阵列的多重共线性问题。通常最小二乘法寻求的是最小花平方残差的综合,公式:在岭回归中,在这种最小化中加入正则化项:其中Г是Tikhonov matrix矩阵,在许...
2019-12-20 22:34:09 3162
翻译 【机器学习】Random Forest、Adaboost、GBDT (非常详细)
本文主要介绍基于集成学习的决策树,其主要通过不同学习框架生产基学习器,并综合所有基学习器的预测结果来改善单个基学习器的识别率和泛化性。集成学习常见的集成学习框架有三种:Bagging,Boosting 和 Stacking。三种集成学习框架在基学习器的产生和综合结果的方式上会有些区别,我们先做些简单的介绍。1.1 BaggingBagging 全称叫 Bootstrap aggrega...
2019-12-17 21:22:44 345
原创 决策树的Cart算法及案例
数据挖掘中使用的决策树有两种类型:1.分类树指预测结果是数据所属的类别2.回归树值预测结果可是是实数(例如:房子的价格,患者在医院逗留的时间等)Cart是二分类算法,将每个特征二分(这里包括离散值和连续值),并经过最优二分特征及最优二分特征值选择、切分,二叉树生成。在最优特征选择上,Cart算法采用基尼系数增益率作为判别标准(这里区别于ID3的信息增益和C4.5的信息增益率)。基尼系数和分...
2019-12-13 15:38:49 5328 6
原创 决策树分类算法
决策树是如何工作的?假设科学家发现了一种新物种。 我们怎么知道它是哺乳动物还是非哺乳动物? 一种方法是提出关于物种特征的一系列问题。 我们可能会问的第一个问题是该物种是冷血还是温血动物。 如果它是冷血,那么它肯定不是哺乳动物。 否则,它是鸟或哺乳动物。 在后一种情况下,我们需要提出一个后续问题:这些物种的雌性是否分娩生下了它们的幼崽? 那些分娩的物种肯定是哺乳动物,而那些不分娩的可能是非哺乳动物...
2019-12-11 13:47:30 1527
原创 熵和信息增益
熵:通常指随机变量取值的不确定性例如:在花坛边坐着一个人,我让你去猜他的性别?由于你不确定他是男还是女,只能随机猜测一个,此时的熵就等于1,对其取值的不确定性等于1,如图所示:当X轴取0.5时,不确定性最大为1.熵计算公式:信息增益:指当知道了另外一个属性时,对随机变量取值的不确定性减了多少。例子:还是猜男女,假如现在有一个“抽烟”的属性X:{a:[‘smoke’],b:[‘None...
2019-12-11 13:32:20 362
原创 数据进行归一化原因
为什么要进行归一化处理,下面从寻找最优解这个角度给出自己的看法。例子假定为预测房价的例子,自变量为面积,房间数两个,因变量为房价。那么可以得到的公式为:[公式]其中[公式]代表房间数,[公式]代表[公式]变量前面的系数。其中[公式]代表面积,[公式]代表[公式]变量前面的系数。首先我们祭出两张图代表数据是否均一化的最优解寻解过程。未归一化:归一化之后为什么会出现上述两个图,并且...
2019-12-09 22:24:35 1408
原创 Python+pandas计算数据关联系数
本文主要演示pandas中DataFrame对象corr()方法的用法,该方法用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数和spearman相关系数)。perason描述的是两个变量之间的线性相关性,当相关系数等于1时,为正相关,x和y正好散落在直线上,并且变量y随着x的增加而增加,当相关系数等于-1时,为负相关,x和y很好的散落在直线上,变量y随着x的增大而...
2019-11-10 16:35:42 1778
原创 mysql创建数据库并设置编码格式
create database face_to_face charset=utf8mb4;字符解释:create database 是创建数据库语句face_to_face 数据库名称charset 表示设置编码格式为utf8mb4
2019-10-14 16:50:12 2256
原创 win10安装mysqlclient出现Cannot open include file: 'mysql.h': No such file or directory
win10安装mysqlclient出现Cannot open include file: ‘mysql.h’: No such file or directory欢迎使用Markdown编辑器在使用python的pip安装安装mysqlclient时,出现如下错误:|████████████████████████████████| 92kB 3.0MB/sBuilding wheels...
2019-08-16 17:46:15 3714 7
原创 mysql数据库备份与恢复
mysql 数据库备份与恢复配置mysql的bin log日志在windows中找到 my.ini 配置文件,在mysqld的配置项配置server_id=123456log_bin = mysql-binbinlog_format = ROWubuntu:sudo vim /etc/mysql/mysql.conf.d/mysqld.cnfserver-id = 1234...
2019-08-01 21:36:20 140
原创 mysql练习题
表关系和数据–学生表 Studentcreate table Student(SId varchar(10),Sname varchar(10),Sage datetime,Ssex varchar(10));insert into Student values(‘01’ , ‘赵雷’ , ‘1990-01-01’ , ‘男’);insert into Student values(‘02...
2019-07-30 19:46:03 411
原创 python爬虫实现域名下载
author = ‘li lee’import requests,re,timeimport refrom lxml import etreefrom multiprocessing import Process,Poolimport threading#爬虫类class Reptile():#urlurl = ''#定义头信息headers = { 'User-Ag...
2019-07-23 20:49:47 249
原创 python发送post请求携带json数据报415错误
author = ‘li lee’import requests,json#定义urlurl = ‘https://open.ucpaas.com/ol/sms/getsmstemplate’#定义请求头headers = {‘User-Agent’:‘Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:68.0) Gecko/20100101 F...
2019-07-18 17:42:29 4512
原创 爬虫发送带headers报错内容为ValueError: too many values to unpack (expected 2)
这个是我报错的代码:author = ‘li lee’import requests#变量url接收访问地址url = ‘http://www.baidu.com’#加headers(将浏览器的用户代理,写到headers中)#用于重置User-Agent(之前是request)伪装成浏览器headers = {‘Mozilla/5.0 (Windows NT 10.0; Win6...
2019-07-18 11:01:55 1991
原创 魔术方法__call__的使用
有关于魔术方法__call__的使用场景,我也是查找了很多资料,下面介绍一下心得魔术方法是指在某个情况下自动触发的方法call触发时机:将类的实例对象当做函数调用时,会自行触发作用:常用语归结类/对象的操作步骤,方便后期的调用案例:class Demo():name = Noneage = None#魔术方法之初始化def init(self,name,age):self.n...
2019-07-12 11:57:28 815
原创 python初学ATM小项目
**此次内容适用于python初学者**一、基础阶段项目要求1.ATM自动存取款系统的程序1.注册(用户名,手机号,身份证号(18位),密码(确认两次)(长度6位))2.查询(账号(必须存在),密码(确认3次,不对就锁卡))3.取款(账号(必须存在),密码(确认3次,不对就锁卡))4.存款(账号(必须存在),金额不能低于0,存款的金额必须是纯数字)5.转账(你的账号,被转的账...
2019-07-12 09:53:37 644
原创 django.db.utils.OperationalError: no such table: xxx错误
问题描述:1、在创建表结构时,先执行python manage.py makemigrations将表修改内容迁移到migrations中(即app下面的migrations的目录)2、执行创建表命令 python manage.py migrates,创建表的时候出现如下图的错误。3、解决办法在你数据库中有一个django_migrations数据表,这里存储了你之前很多的信息,找到你需...
2019-03-17 16:30:30 7653
原创 JavaScript作用域
1、JS作用域(js的作用域是根据函数进行划分)xo = ‘huhansan’;function func(){var xo = ‘eric’;function fo(){var xo = ‘alex’;console.log(xo);}fo();}func();2、作用域链(当函数内部的局部变量不可用时,会自动向上一级寻找)xo = ‘huhansan’;functio...
2019-02-28 17:23:30 92
原创 主机能ping通虚拟机,但是虚拟机ping不同主机
1、首先打开虚拟机的 编辑-> 虚拟网络编辑器-> 选择VMnet8,查看子网Ip和NAT模式中的网关2、打开主机的网络连接,设置VMnet8的Ip地址和网关(与上述的Ip地址同网段)3、接下来修改虚拟机的Ip地址,vi /etc/sysconfig/network-scripts/ifcfg-eth0(这个名字每台虚拟机可能都不一样,但大体相同),修改IP地址和网关如下图:4、...
2019-02-22 00:52:12 1393 1
转载 wmware虚拟网卡 VMnet8 VMnet1未识别网络解决方法(主机和虚拟机互ping不通)
VMware Network今天ping了下虚拟机和主机 ,ping不通。后来发现VMware Network Adapter VMnet1和VMnet8 被归入[未识别的网络解决方法:1,进入注册表[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Class{4D36E972-E325-11CE-BFC1-08002BE10318}...
2019-02-22 00:09:09 4868 7
原创 如何修改HTML文件的显示图标呢?
1、首先找到你创建的HTML文件2、将该文件添加快捷键到桌面3、右键属性4、点击更改图标,选择你准备好的图标(图标格式为xxx.ico)
2019-02-18 13:56:09 6423
原创 面试官问项目经验,其实是想要听这些!!!
▉1、个人介绍当你面试测试时最重要的是,哪年毕业的,参加工作几年了,我是谁,我上家公司是谁,公司做的项目是什么,我负责哪个模块,写测试用例用的什么方法,在测试中,用到了哪些测试工具,最擅长的是功能测试,性能测试,自动化测试,以及你是怎么操作的,几乎这样的介绍,涵盖了面试官想听项目经验的重点。▉2、你觉得你个性上最大的优点是什么?回答提示:沉着冷静、条理清楚、立场坚定、顽强向上。乐于助人和关...
2019-02-15 16:32:48 3590
翻译 app测试和web测试的区别
app测试和web测试的区别看过了千里大腿的blog,再加上最近也有一些同学问我web与app测试的区别。所以在这里也献丑,写一篇随笔。希望对大家有所帮助。笔者做了快三年的测试了。大部分时间都在做app的测试,web测试也做了半年左右。其实我觉得这两者并没有什么大的区别。仅仅从功能测试的层面上来讲的话,在流程和功能测试上是没有区别的。那么区别在哪里呢?我个人觉得就是由于载体不一样,所以系统...
2019-02-15 11:05:01 2143
原创 linux使用ifconfig/ip addr搜索不到Ip地址
2018-12-16 踩坑,为了让更多像我一样的坑主能够尽早脱坑,写下这篇文章先说说怎么踩坑的吧,也就是2018-12-15号晚,跟着百度文章,将“网络模块”的配置文件改了一下,然后就是今天用了一小时的时间出坑,我就直接说,我是怎么解决的吧,那么接下来各位看官,您瞧好了!!!!!!1、跟着百度走,说是有可能是因为“网络管理员”影响网络模块自启动,然后我就关闭“网络管理员” service Ne...
2018-12-16 18:23:23 3728
原创 centos下解决yum -y install mysql-server没有可用包问题
1、现象2、百度之后,发现需要先在线安装一个自动下载工具wget命令: yum -y install wget3、然后执行命令:4、5、最后,执行在线安装mysql-server服务器即可...
2018-12-16 00:17:19 967
原创 Jmeter取样器报错Cannot create PoolableConnectionFactory (Could not create connection to database server.)
上面是报错的图片!!!总体上有这么几个原因1、由于mysql驱动版本太低导致。2、数据库权限不够导致(①、登陆mysqlmysql -u root -p②、修改mysql库的user表,将host项,从localhost改为%。%这里表示的是允许任意host访问,如果只允许某一个ip访问,则可改为相应的ip,比如可以将localhost改为192.168.1.123,这表示只允许局域网...
2018-12-08 19:39:24 11899 5
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人