自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 python装饰带参数 python装饰器不带参数 代码案例

【代码】python装饰带参数 python装饰器不带参数 代码案例。

2023-04-06 17:54:14 336

原创 Python 连接Postgresql 批量查询 插入操作

1、首先安装 Psycopg2 模块( 这是用来与postgresql进行连接并操作的)安装命令: pip install Psycopg22进行连接conn = psycopg2.connect(database="数据库名", user="用户名", password="密码", host="ip地址如果是本机就写localhost)", ...

2020-03-13 22:03:24 1307

原创 机器学习 评估指标 之混淆矩阵以及可视化

1、混淆矩阵它是衡量分类型模型准确度中最基本,最直观,计算最简单的方法 以实际标签为行, 预测标签为列例如: 0 1 2 (实际标签) 0 45 4 3 1 11 50 5 2 2 5 55 主对角线上的值越大其余地方值越小说明模型越好2、代码实现 以及可视化 操作# -*- coding:utf-8 -*-...

2020-02-18 16:04:39 755

原创 机器学习 评估指标之交叉验证

1、交叉验证通俗的讲就是将样本均分为几等份,拿出某一(几)份作为测试样本,剩下的作为训练样本,去预测得到相应指标(准确率,召回率,f1等),再抽取另一份(几份)作为测试样本,剩下的作为训练样本,去预测得到相应指标(准确率,召回率,f1等) ,使得每一份样本都参与到测试集中,最终返回一个指标列表。2、案例代码数据下载地址链接: https://pan.baidu.com/s/1f-C7LS...

2020-02-18 15:31:56 1212

原创 机器学习 之评估指标 召回率,查准率,F1分数(f1值)

1、召回率:评价模型的完整性预测样本中的预测正确的信息条数/总样本中所有的属于这类样本的信息条数 举例:这里用鱼和虾举例 TP:将鱼预测为鱼 FP:将虾预测为鱼 FN:将鱼预测虾 TN:将虾预测为虾 召回率R = TP/(TP+FP) (正确预测鱼的信息条数/原样本中所有鱼的信息条数)2、查准率:评价模型的正确性预测样本中的预测正确的信息条数/预测样本中所有的信息条数准确率P =...

2020-02-18 14:30:54 2066

原创 Python获取图片base64位编码

from PIL import Imageimg = Image.open("a.jpg")import base64with open("a.jpg", 'rb') as f: base64_data = base64.b64encode(f.read()) s = base64_data.decode() print('data:image/jpeg;base...

2020-02-18 10:14:58 2074

原创 Python爬虫之 selenium +chrome+队列+多线程 爬取Boss

我们就直接长驱直入1、将chrome.exe配置到我们的环境变量中**一般没有更改目录都在这里**![在这里插入图片描述](https://img-blog.csdnimg.cn/2020021615430325.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nL...

2020-02-16 15:51:33 1951

原创 机器学习之线性回归算法原理推导

1、什么是回归假设线性回归是个黑盒子,那按照程序员的思维来说,这个黑盒子就是个函数,然后呢,我们只要往这个函数传一些参数作为输入,就能得到一个结果作为输出。那回归是什么意思呢?其实说白了,就是这个黑盒子输出的结果是个连续的值。如果输出不是个连续值而是个离散值那就叫分类。那什么叫做连续值呢?非常简单,举个栗子:比如我告诉你我这里有间房子,这间房子有40平,在地铁口,然后你来猜一猜我的房子总共值多少...

2020-02-14 15:21:35 631

原创 机器学习 数据预处理之标签编码

1、什么是标签编码将字符型的特征映射为整数(将字符串转换为整数)但没有被广泛使用因为求平均值之类的数据会出现问题(不过具体需求具体分析)有[dog,cat,dog,mouse,cat],我们把其转换为[1,2,1,3,2]。这里就产生了一个奇怪的现象:dog和mouse的平均值是cat。所以目前还没有发现标签编码的广泛使用(不过在决策树,随机森林对数据值不做要求的算法中是常见的)调用库包代码...

2020-02-13 15:08:37 4294

原创 机器学习 数据预处理之独热编码

1、什么是独热编码让由0和1组成的占位符取表示每列特征,让不同样本之间相同特征之间的两两距离(两两差异)相同例: 特征1 特征2 特征3 数据集 1 3 2 7 5 4 1 8 ...

2020-02-13 14:58:02 1066

原创 机器学习 数据预处理之二值化

1、什么是二值化用0和1来表示样本矩阵中相对于某个给定阈值高于或者低于它的元素2、作用作用:一般用在图像处理 (将图像分成黑和白 常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群)3、示例代码import numpy as npsample = np.array([ [2, 4, 5, -1], [3, 1, 7, -2],...

2020-02-13 14:52:32 1619

原创 机器学习 数据预处理之归一化

1、什么是归一化为了用占比表示特征,每个样本的特征值除以该样本的特征值绝对值之和(对行《样本》操作),使得每个样本的特征值绝对值之和为1 (这里的一般可以在某个东西的增长率或者占比的时候使用)例如: python java C PHP2017 30 50 40 ...

2020-02-13 14:24:31 548 2

原创 机器学习数据预处理之范围缩放

1、什么是范围缩放 统一样本矩阵中的不同特征的最大值和最小值的范围。(一般都是0-1) 例如设样本集为X [0, 1, 2, 3,4, 5 ] 范围缩放到【0-1】后 X1 [0, 0.2, 0.4, 0.6, 0.8, 1]kmin+ b = min’ =0 原本特征中的最小值转换为0(每列特征的k.b都不一样)kmax+b = max’=1 原本特征中的...

2020-02-13 14:09:58 1393

原创 机器学习 常见数据预处理操作之均值移除

1、什么是均值移除在介绍均值移除之前 先介绍一下数据在做处理时一般都是认为一行一样本,一列一特征 而我们的均值移除操作也基本是对列(特征)进行操作均值移除:平均值调整为0 标准差调整为1设数据集为X 【7,8,9,10,11】数据集的平均值为M = 9数据集的标准差S = 2以下是标准差公式求出上述所需条件以后数据集为X 每个数减去平均值以后在除以标准差即可把平...

2020-02-13 12:01:38 2636 1

原创 echarts wordCloud画词云图(自定义背景)

由于论文需要所以自学了echarts画词云图,首先需要下载echarts-4.2.1.min.js (版本可以为其他的)与echarts-wordcloud.min.js(点击点我下载即可下载)链接:点我下载提取码: htku文件位置:\echarts-wordcloud-master\dist\下任意一个文件都可以下载完成以后引入文件<script src="/static/js...

2020-02-12 01:11:30 82358

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除