自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 收藏
  • 关注

原创 【LeetCode算法题】数组经典题目分析

本文对LeetCode中的数组类的经典题目进行分析,题目序号分别为704.二分查找27.移除元素977.有序数组的平方209.长度最小的子数组59.螺旋矩阵ll。

2024-01-17 19:38:58 1141

原创 【LeetCode算法题】各类排序算法的Python实现

对于直接插入排序、折半插入排序、选择排序、冒泡排序、归并排序,快速排序、堆排序算法的Python实现进行记录。

2024-01-17 18:24:46 651

原创 程序代码编写基本规范

良好的代码编写习惯有助于代码维护。

2024-01-14 11:18:35 463

原创 【机器学习】机器学习绪论

本章机器学习绪论从基本术语假设空间和归纳偏好三个方面进行论述。

2023-02-15 12:33:24 259

原创 【数据库基础10】并发控制

事务可以一个一个地串行执行,即每个时刻只有一个事务运行。在单处理机系统中,事务的并行执行实际上是这些并行事务的并行操作轮流交叉运行。这种并行执行方式称为交叉并发方式。在多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行。这种并行执行方式称为同时并发方式。

2023-02-14 13:09:59 546

原创 【数据库基础09】数据库恢复技术

事务是一系列的数据库操作,是数据库应用程序的基本逻辑单元。事务处理技术主要包括数据库恢复技术和并发控制技术。数据库恢复机制和并发控制机制是数据库管理系统的重要组成部分。

2023-02-14 11:20:15 1437

原创 [数据库基础08]关系查询处理和查询优化

本章介绍关系数据库的查询处理和查询优化技术。

2023-02-13 16:06:49 351

原创 [数据库基础07]数据库设计

数据库设计是指对于一个给定的应用环境,构造优化的数据库逻辑模式和物理结构,并据此建立数据库及其应用系统,使之能够有效地存储和管理数据,满足各种用户的应用需求,包括信息管理和数据操作要求。

2023-02-13 14:28:08 252

原创 【数据库基础06】关系数据理论—规范化

一个低一级范式的关系模式通过分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫规范化。

2023-02-11 18:15:21 310

原创 【数据库基础05】数据库完整性

关系模型的实体完整性在create table中用primary key定义。触发器是用户定义在关系表上的一类由时间驱动的特殊过程。

2023-02-11 14:17:18 424

原创 【数据库基础04】数据库安全性

数据库的安全性是指保护数据库以防止不合法使用所造成的数据泄露、更改或破坏。

2023-02-11 12:24:22 346

原创 【数据库基础03】关系数据库标准语言SQL

本章将具体介绍SQL概述、学生—课程数据库、数据定义数据查询数据更新以及视图。结构化查询语言(SQL)是关系数据库的标准语言,也是一个通用的、功能极强的关系数据库语言。

2023-02-10 11:09:37 1225

原创 【数据库基础02】关系数据库

本章将具体介绍关系数据结构及形式化定义关系操作关系的完整性及其关系运算。

2023-02-07 20:33:47 553

原创 【数据库基础01】数据库系统绪论

本章将具体介绍数据库基本概念、数据模型、数据库系统的结构及其组成。

2023-02-06 20:48:39 826

原创 数据标准化与归一化 及其区别

介绍了标准化与归一化的基本方法及区别。需要特别注意,除了去除量钢化需要归一化或标准化,还需考虑基于参数的模型或者基于距离的模型,需要对参数或者距离进行计算,都需要进行归一化。

2023-02-03 15:59:23 3971

原创 【大数据竞赛】2022MathorCup大数据挑战赛 B题 北京移动用户体验影响因素研究 探索性数据分析

该系列文章分为问题分析,探索性数据分析,特征工程,模型建立四个部分,以此来记录完成本次竞赛的具体思路,及对部分问题的补充研究。若需要附件数据,评论区留邮箱,看到会回复。

2023-02-03 15:08:41 1090 3

原创 【数据编码】构造虚拟特征变量(OneHotEncode)

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点。将离散型特征使用one-hot编码,会让特征之间的距离计算更加合理。

2023-02-02 23:05:07 685

原创 【EDA与特征工程】数据探索与特征工程综合指南

本综合指南主要参考《A Comprehensive Guide to Data Exploration》进行编写,用作日常学习。原文中将缺失值插补与异常值处理两大块作为数据探索部分,通过查阅资料及结合数据分析经验,本文将变量识别、单变量分析、双变量分析划为探索性数据分析(EDA) 部分,将缺失值插补、异常值处理、变量转化、特征/变量构造、特征筛选及降维划为特征工程部分。

2023-02-02 21:56:58 887

原创 【特征工程】重要特征识别理论(特征筛选)

从众多影响因素中识别出重要因素的过程可以视为一个特征选择过程。在建立机器学习模型进行预测时,输入的特征集会直接影响模型效果,特征太少容易不能全面刻画数据潜在关联,造成模型欠拟合;特征太多时会存在不相关的特征或者特征冗余的情况,甚至出现“维度灾难”,会造成模型精确度无法提升、运行速度慢、过拟合等情况。特征选择是为了从全部特征中找到最优的特征子集,剔除其中不相关或冗余的特征,从而提高模型拟合程度,加快运行速度,同时选取出真正相关的特征简化模型,协助理解数据决策的过程。

2023-02-01 16:46:11 1012

原创 【大数据竞赛】2022MathorCup大数据挑战赛 B题 北京移动用户体验影响因素研究 题目分析

该系列文章分为问题分析、数据探索性分析、特征工程、模型建立四个部分,以此来记录完成本次竞赛的具体思路,及对部分问题的补充研究。

2023-02-01 13:54:56 1130

原创 【机器学习】贝叶斯分类器(算法原理实现及sklearn实现)

贝叶斯分类器作为“生成式模型”可处理多分类问题,在数据较少的情况下依然有效,本文介绍了算法原理推导及基于算法原理的代码实现与基于sklearn包的代码实现。

2022-12-18 12:50:22 2921

原创 机器学习中的判别式模型和生成式模型

在机器学习中,对于有监督学习可以将其分为两类模型:判别式模型和生成式模型。简单地说,判别式模型是针对条件分布建模,而生成式模型则针对联合分布进行建模。

2022-12-17 13:22:01 225

原创 [Numpy] Numpy中的矩阵运算(矩阵乘法、矩阵分解、行列式等)

线性代数(如矩阵乘法、矩阵分解、行列式以及其他方阵数学等)是任何数组库的重要组成部分,NumPy提供了一个用于矩阵乘法的dot函数(既是一个数组方法也是numpy命名空间中的一个函数)

2022-12-06 21:15:23 1155

原创 【概率论理论】协方差,协方差矩阵理论(机器学习)

  在许多机器学习算法中需要求出两个分量间相互关系的信息。协方差就是描述这种相互关联程度的一个特征数。相关系数矩阵是标准后的协方差矩阵。

2022-12-06 18:47:40 1815

原创 StandarScaler(sklearn.preprocessing)标准化中的fit、transform理解。

sklearn里的封装好的各种算法使用前都要fit,fit对于算法而言,相当于拟合出具体的模型参数,后续可基于模型进行一些一系列操作(如预测等)。fit对于整个代码而言,为后续API服务。fit之后调用各种API方法,transform只是其中一个API方法;

2022-12-06 11:13:30 1910

原创 从技术方面如何更好的理解什么是机器学习?

机器学习的技术定义:在预先定义好的可能性空间中,利用反馈信息的指引来寻找输入数据的有用表示。

2022-12-02 12:43:02 486

转载 LaTex符号大全(LaTeX_Symbols)

【代码】LaTex符号大全(LaTeX_Symbols)

2022-11-30 17:01:38 389

原创 贝叶斯公式证明及Bayesain在机器学习重要地位的理解

  经典的Bayesian在机器学习中如此重要,就是因为人们希望机器人能像人那样思考,而很多问题是需要计算机在已知条件下做出最佳决策的决策,而贝叶斯公式就是对人脑在已知条件下做出直觉判断的一种数学表示。

2022-11-25 22:04:52 396

转载 先验概率和后验概率的通俗解释(贝叶斯分类)

通俗的理解先验概率和后验概率;贝叶斯方法在机器学习中如此重要,就是因为人们希望机器人能像人那样思考,而很多问题是需要计算机在已知条件下做出最佳决策的决策,而贝叶斯公式就是对人脑在已知条件下做出直觉判断的一种数学表示。

2022-11-25 19:14:02 646

转载 Kingbase详细安装教程

kingbase客户端工具是人大金仓提供的连接KES数据库的图形化客户端工具。它是基于JAVA语言开发的能运行在不同操作系统平台上的图形工具,用于访问、配置、控制和管理 KingbaseES 数据库服务器。管理和配置KingbaseES数据库服务器。管理各种KingbaseES数据库对象。进行KingbaseES数据库的安全管理。调用查询分析器执行和测试SQL语句。

2022-11-20 22:01:37 8364

原创 Seaborn数据可视化——一篇详细的学习记录

本文详细简介的记录了利用Seaborn进行可视化操作,数据可视化是数据分析中重要的一步,在前期数据的探索性分析,以及后期结果的呈现中都有着重要地位。更加全面的教学可进入KaggleSeaborn教学进行学习。

2022-11-03 19:43:10 1853 2

原创 Bunch转化为DataFrame的一般方法

Bunch转换为DataFrame的一般方法

2022-11-03 10:05:48 498 1

原创 pd.plotting.register_matplotlib_converters() 的作用

机器学习可视化中,pd.plotting.register_matplotlib_converters() 的作用。

2022-11-01 14:34:14 1355

原创 【博客搭建1】基本框架搭建

Hexo+github个人博客搭建,纯新手教程,效果可查看https://bigdataxy.cc。

2022-10-30 18:26:01 362

原创 【博客搭建1】基本框架搭建

利用Hexo+github搭建个人博客,后续还有主题配置及博客编写教程

2022-10-30 18:19:23 768

原创 【博客搭建2】Sakura主题的配置

Hexo+gthub个人博客,Sakura主题配置,按照步骤一步步进行,你也可以拥有好看的个人博客。

2022-10-30 18:09:51 1316 4

原创 【博客搭建3】利用Typora软件编写个人博客

Typora编写Markdown,记录如何完成一篇博客的步骤。可同步上传知乎,csdn,非常好用

2022-10-30 18:01:59 1015

Microsoft Visual C++ 2013 Redistributable Package

Microsoft Visual C++ 2013 Redistributable Package

2022-11-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除