自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 【python机器学习】——正则化

本文介绍了正则化 基本概念及常见的L1与L2范数是什么,后续将继续介绍机器学习相关内容,下一节介绍Lasso回归、Ridge回归、多项式回归及保险花销预测实战案例。

2024-05-06 23:59:04 1173 1

原创 【python机器学习】——归一化

本文介绍了归一化基本概念及python中如何实现,后续将继续介绍机器学习相关内容,下一节介绍正则化。

2024-05-05 18:02:28 1758 3

原创 【python机器学习】——梯度下降法

梯度下降是一种优化算法,用于机器学习和人工智能中以最小化一个函数。在机器学习中,我们通常试图找到一组参数的值,使得某个损失函数(如成本函数)的值最小。梯度下降算法通过迭代地调整参数的值来实现这一点。

2024-05-04 19:03:41 1456 1

原创 【python机器学习】——线性回归算法

线性回归是机器学习中有监督机器学习下的一种算法。回归问题主要关注确定一个唯一的因变量(dependent variable)(需要预测的值)和一个或多个数值型的自变量(independent variables)(预测变量)之间的关系,本文介绍了基本原理及python下如何实现

2024-02-17 01:27:09 1946 1

原创 conda虚拟环境配置及镜像源修改

一些项目需要不同的python环境,为不影响项目开发及运行,可通过配置虚拟环境进行开发,本文就conda环境配置展开介绍。

2023-10-14 19:52:48 5742 1

原创 机器学习——KNN算法原理

KNN算法是通过计算不同特征值之间的距离来进行分类的算法。其工作原理是这样的,存在一个样本数据的集合,这个样本数据的集合被称作训练样本集,样本集中每个数据的标签与这些数据之间有着一一对应的关系。输入没有标签的新数据后,会将新数据的每个特征与样本集中数据特征进行比较,然后利用相关的距离算法提取样本集中特征最相似数据的分类标签。一般会选择样本数据集中前k个最相似的数据,通常k的取值是不大于20的整数。最后,选择k个最相似数据中出现次数最多的分类,作为新数据的分类。

2023-09-25 22:25:16 167 1

原创 机器学习——numpy

总结,本文介绍了numpy常用功能,帮助大家熟悉numpy的一些用法。##numpy布尔型索引多条件提取数组中的数据。大小相等的数组实现乘法。数组与标量值的除法运算。数组与标量值的乘法运算。

2023-08-27 20:41:23 319 1

原创 python机器学习——数据预处理

数据预处理(data preprocessing)是指在主要的处理以前对数据进行的一些处理。如对大部分地球物理面积性观测数据在进行转换或增强处理之前,首先将不规则分布的测网经过插值转换为规则网的处理,以利于计算机的运算。另外,对于一些剖面测量数据,如地震资料预处理有垂直叠加、重排、加道头、编辑、重新取样、多路编辑等。以上就是今天要讲的内容,本文仅仅简单介绍了数据预处理过程样本均值转为0,标准差转为1的方法,后续还需介绍更多数据预处理过程。

2023-07-08 10:44:57 392

原创 python机器学习——基本概念

机器学习是一门能够让编程计算机从数据中学习的计算机科学。一个计算机程序在完成任务T之后,获得经验E,其表现结果为P,如果任务T的性能表现,也就是用以衡量的P,随着E增加而增加,那么这样计算机程序就被称为机器学习系统。自我完善,自我增进,自我适应。

2023-02-21 19:43:09 370

原创 pandas——数据移位、数据转换、数据合并、数据导出和日期数据的处理,时间序列等

pandas统计分析(下)本文主要介绍使用pandas进行数据移位、数据转换、数据合并、数据导出和日期数据的处理,时间序列等。数据移位数据移位就是在分析数据时,需要移动到上一条,在pandas中,可以使用shift方法获得上一条数据。shift(periods=1, freq=None, axis=0, fill_value=<object object at 0x0000022BE4AA85E0>)参数:periods:表示移动的幅度,可正可负,默认为1。1表示移动一次。这里移

2022-04-23 17:53:51 6530

原创 pandas统计分析(下)——数据格式化、分组统计

本文介绍了pandas中的常见的数据格式化、分组统计等相关知识

2022-04-22 20:46:13 1878

原创 pandas统计分析(下)——数据计算

本文主要介绍pandas常见的数据计算方法如求和、最大/小值,方差等

2022-04-19 11:07:45 3053

原创 pandas统计分析(上)

本文主要介绍如何导入外部数据、数据抽取、以及数据的增加、修改、删除,还包括数据清洗、索引设置、数据排序与排名等,为后续数据处理和数据分析打下良好的基础。

2022-04-16 20:57:41 1983

原创 数据分析开发环境——Anaconda安装

安装Anaconda,适合学习使用,可以解决学习过程中各种需求的包的问题。之后可自行安装需要的包

2022-03-09 18:12:04 215

原创 python安装和配置

介绍了python环境的基本安装与配置

2022-03-08 12:19:16 829

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除