自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 MySQL窗口函数简介

非聚合窗口函数是相对于聚函数来说的。聚合函数是对一组数据计算后返回单个值(即分组),非聚合函数一次只会处理一行数据。窗口聚合函数在行记录上计算某个字段的结果时,可将窗口范围内的数据输入到聚合函数中,并不改变行数。内指定一个计算窗口,也就是一个与当前行相关的数据子集。选项用于将数据行拆分成多个分区(组),它的作用类似于。以及窗口大小(frame_clause。分区(PARTITION BY。,所有的数据作为一个组进行计算。窗口函数又被称为开窗函数,与。是参数,有些函数不需要参数;排序(ORDER BY。

2024-05-16 20:48:37 377

原创 MYSQL数据库中MyISAM和InnoDB的区别

主键索引采用聚集索引,辅索引的数据域存储主键的值,因此从辅索引查找数据,需要先通过辅索引找到主键值,再访问辅索引,最好使用自增主键,防止插入数据时,为维持B+树结构,文件的大调整。采用非聚集索引,索引文件的数据域存储指向数据文件的指针。=辅索引与主索引基本一致,但是辅索引不用保证唯一性。一个InnoDB引擎存储在一个文件空间,也可能为多个,受操作系统文件大小的限制;一个MYISAM表有三个文件:索引文件、表结构文件、数据文件;支持ACID的事务,支持事务的四种隔离级别;不支持事务,但是每次查询都是原子的;

2024-05-16 19:39:51 395

原创 机器学习K近邻KNN简介应用及优缺点

具体来说,KNN算法通过计算待分类样本与已知样本之间的距离(欧式距离、曼哈顿距离等),选取距离待分类样本最近的K个已知样本,再通过对这K个已知样本的类别进行投票、取平均等方式确定待分类样本的类别。对于不平衡数据集的处理效果较差:如果训练集中的某个类别的数据样本比其他类别的数据样本数量少,那么KNN算法会偏向于选择数量较多的类别进行预测,从而影响预测结果的准确性。基因分类:KNN可以用于对基因进行分类,例如在癌症研究中,可以使用KNN分类器来识别患有癌症的患者和健康人之间的基因表达模式的差异。

2024-05-12 18:17:04 279

原创 L1和L2正则化的区别和联系

L2正则化则倾向于使所有特征的系数都接近于0但不为0,这有助于保持模型的复杂度适中,适用于特征之间没有关联的情况。L1正则化可以产生稀疏权值矩值,即模型中的某些权重会变力0,这有助于特征选择,适用于特征之间存在关联的情况。在实际应用中,L和L2正则化经常被用于不同的场景, L1适用于特征选择,L2适应于保持模型的稳定性。都用于防止过拟合,通过在损失过数中添加正则化项来减少模型的更杂度,从而提高模型的泛化能力。L2正则化不会产生稀疏权值矩阵,所有特征的系数都会减小但不会变为0,这使得模型更加稳定。

2024-05-12 10:46:29 289

原创 逻辑回归LR不使用平方差损失函数的原因

5.对数损失函数:逻辑回归通常使用对数损失(Log Loss)作为损失函数,它能够更好地处理分类问题,并且具有凸性质,有助于梯度下降在训练时的快速收敛。2.梯度消失问题:当使用平方损失函数时,由于sigmoid函数在输入值很大或很小时的平坦区域,其导数会变得非常小,甚至接近于0,导致梯度消失。综上所述,逻辑回归不使用平方损失函数而选择交叉熵损失函数是因为它能够更好地处理预测值的概率性质,避免梯度消失问题,确保模型训练的稳定性和全局最优性的追求。而平方误差函数可能导致非凸问题,从而容易陷入局部最优。

2024-05-12 09:51:41 228

原创 机器学习Logistic逻辑回归简介应用及优缺点

逻辑回归(Logistic regression,简称LR)是一种经典的二分类算法,它将输入特征与一个sigmoid函数进行线性组合,从而预测输出标签的概率。总之,Logistic回归是一种灵活的算法,可以应用于许多不同的领域和问题,特别是在需要预测二元结果的场景中表现出色。银行和信用卡公司使用Logistic回归来评估借款人的信用风险,预测贷款违约的概率。Logistic回归可以用于预测产品或服务的市场需求,并帮助企业做出更好的决策。Logistic回归的输出结果是概率,易于解释。

2024-05-12 09:41:58 161

原创 机器学习LR线性回归简介

一元线性回归模型的数学表达式为:Y = β0 + β1*X + ε,其中Y是因变量,X是自变量,β0和β1是回归系数,ε是误差项。经济学和金融学:线性回归可以用于预测经济指标(如GDP、通货膨胀率等)与自变量(如消费、投资、出口等)之间的关系,进行经济预测和政策分析。线性回归的目标是通过拟合最优的直线(一元线性回归)或超平面(多元线性回归)来描述自变量与因变量之间的关系。医学和健康科学:线性回归可用于分析医学和健康领域的数据,例如预测疾病发展与风险因素之间的关系,评估治疗方法的效果,分析生物医学数据等。

2024-05-10 15:52:15 301

原创 机器学习中优化算法的比较

算法 优点 缺点 适用情况 牛顿法 收敛速度快 靠近极小值时收敛速度减慢,求解Hessian矩阵的逆矩阵复杂,容易陷入鞍点 不适用于高维数据 拟牛顿法 收敛速度快,不用计算二阶导数,低运算复杂度 ...

2018-09-20 15:26:40 1070

原创 sql介绍

结构化查询语言(Structured Query Language)简称SQL,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。SQL 是1986年10 月由美国国家标准局(ANSI)通过的数据库语言美国标准,接着,国际标准化组织(ISO)颁布了SQL正式国际标准。1989年4月,ISO提出了具有完整性特征的SQL89标准,199...

2018-07-26 21:20:24 277

原创 urllib库的高级用法

1. 伪装自己有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作1.1 设置请求头其中User-Agent代表用的哪个请求的浏览器代码如下:from urllib.request import urlopenfrom urllib.request import Requesturl = 'http://www...

2018-07-25 20:40:56 208

原创 爬取数据-urllib库

1. 小试牛刀怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便是他的骨架,JS便是他的肌肉,CSS便是它的衣服。所以最重要的部分是存在于HTML中的,下面我们就写个例子来扒一个网页下来from urllib.request...

2018-07-25 19:10:22 348

原创 什么是爬虫

1. 什么是爬虫?网络爬虫也叫网络蜘蛛,如果把互联网比喻成一个蜘蛛网,那么蜘蛛就是在网上爬来爬去的蜘蛛,爬虫程序通过请求url地址,根据响应的内容进行解析采集数据, 比如:如果响应内容是html,分析dom结构,进行dom解析、或者正则匹配,如果响应内容是xml/json数据,就可以转数据对象,然后对数据进行解析。2. 有什么作用?通过有效的爬虫手段批量采集数据,可以降低人工成本,提高...

2018-07-23 21:15:29 3985

原创 python3基础语法

标识符1.第一个字符必须是字母表中字母或者下划线_.2.标识符的其他部分由字母、数字和下划线组成。3.标识符对大小写敏感python保留字保留字即关键字,我们不能把它们用作任何标识符名称。Python 的标准库提供了一个 keyword 模块,可以输出当前版本的所有关键字:>>> import keyword>>> keyword.k...

2018-07-17 13:31:13 181

原创 如何卸载MySQL

如何彻底的删除MySQL数据库: 以下操作以Window7操作系统为例: 1)停止window的MySQL服务。    找到“控制面板”-> “管理工具”-> “服务”,停止MySQL后台服务。2)卸载MySQL安装程序。找到“控制面板”-> "程序和功能",卸载MySQL程序。3)删除MySQL安装目录下的所有文件。4)删除c盘ProgramData隐藏目录中关于MySQL的目...

2018-07-09 12:51:06 6794

原创 MySQL安装图解

一、MYSQL的安装1、打开下载的mysql安装文件,双击运行mysql-5.5.40-win32.msi。2.选择安装类型,有‘Typical(默认)’、'Complete(完全)'、'Customer(用户定义)'三个选项,选择Custom,按next继续3、在“DeveloperComponents(开发者部分)”上左键单击,选择“This feature,and allsubfeature...

2018-06-30 15:03:05 345

原创 MySQL简介

MySQLMySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,目前属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件。MySQL是一种关系数据库管理系统,关系数据库将数据保存在不同的表中,而...

2018-06-22 20:02:41 3358

原创 数据库相关概念

  数据   描述事物的符号   多种表现形式:文本,图形,音频,视频数据库(Database, DB)粮库 车库存放数据的仓库 存放在计算机中,按照一定格式存放 可为用户共享数据库管理系统(Database Management System, DBMS)如何科学的组织和存储数据,如何高效的获取和维护数据,靠数据库管理系统完成Oracle 、MySQL、 SQL Server、 DB2 FoxP...

2018-06-22 19:55:05 116

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除