自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (1)
  • 收藏
  • 关注

原创 线性回归-全篇+案例

线性回归是机器学习中最基础,应用最为广泛的模型之一。在回归分析中,线性回归模型是指因变量Y与自变量X之间存在线性关系,即Y的变化可以由X解释。线性回归模型可以用于预测与建模,本文将通过几个个案例展示如何使用Python实现线性回归模型。

2023-10-05 19:56:23 2542

原创 pandas全篇--带案例练习资料

Pandas是Python中一个非常重要的数据分析库,它提供了高效地操作和处理各种数据结构的方法和工具。其中,最常用的数据结构之一是DataFrame,它是由行和列组成的二维表格,可以存储和处理各种数据类型的数据。在Pandas中,我们可以通过多种方式来创建DataFrame,包括通过列表、字典、二维数组等方式。

2023-10-05 19:31:36 196

原创 数学建模2022首届钉钉杯 (练习题a题简单实现)———— 练习(1)

这几天实在是,有点困,不太想写文章了,所以想先水一下,自己写的代码,可能有误!不过话说能运行就是王道。希望大佬们帮忙纠正纠正。作为菜鸡的我先行谢过!模型得分为0.6562596295598755。......

2022-07-21 19:32:37 2307 1

原创 数学建模学习(2)—— 客户流失预警模型案例评估 ROC曲线与KS曲线(2022.7.19)

命中率(真正率)假报警率1(预测流失)0(预测不流失)合计1(实际流失)TP=0正确肯定FN=2000漏报TP+FN=20000(实际不流失)FP=0虚报TN=5000正确否定FP+TN=5000总体来说,命中率计算是所有实际流失(分类为1)的客户中被预测为流失客户所占的比例,也成真正率,或召回率;而假警报计算的则是所有实际未流失(分类为0)的客户所占的比例,也称假正率。大家可以通过如下公式加深记忆和理解。......

2022-07-19 21:10:57 3085 2

原创 数学建模学习(1)———— 逻辑回归的使用和案例(2022.7.18)

逻辑回归是一种分类模型,但为什么会含有回归二字了,是因为算法原理同样涉及到回归方程,方程如下上面个方程是用来预测连续变量的,取值范围为R逻辑回归,是用来预测物体是a类还是b类,但本质其实是预测该物体属于a或b的概率,而概率的取值范围为(0,1),所以不能直接用线性回归方程来预测概率,那么如何把一个取值范围是R的回归方程变为取值范围为(0,1)的内容了?我们就需要,使用Sigmoid函数#sigmoidplt.show()out。......

2022-07-17 22:07:00 4535 2

原创 数据分析 pandas and matplotlib详细学习(3)———— 数据处理(2022.7.16)

pandas中除了数据的处理和数据表的拼接函数以外,还有比较多函数,像groupby等还没实现,但已经学习了基本的知识,其他函数将直接在后面案例中使用和介绍。

2022-07-16 20:27:39 172

原创 数据分析 pandas and matplotlib详细学习(2)———— pandas操作excel(2022.7.14)

以下数据皆从读书《python大数据分析与机器学习》获取所得,结合网上查找和其他书籍进行整理的自己的笔记。 以前刚学习python的时候就喜欢弄这些看的见得操作,特别是这个,话不多说实例如下:out:我们可以看到,已经读取成功了,我们打开excel对比一下,我们可以看到,数据是一样的,我们知道在excel中一个文件可能有多个表这时我们就可以设置参数sheet_name=0读取第1个工作表,和其他工作表了。其次就是格式问题,有些打开可能是乱码,这时需要enconding='utf-8'或‘gbk

2022-07-14 17:39:15 1596

原创 数据分析pandas and matplotlib详细学习(1)———— Dataframe介绍(2022.7.13)

pandas 常用 pd作为简称matplotlib 常用 plt作为简称 与numpy相比,pandas库更擅长处理二维数据,pandas库主要有Series和DataFrame两种数据结构。Series类似于通过Numpy库创建的一维数组,不同的是Series 对象不仅包含数组,还包含一组索引,其创建方式如下:out : 0 小猪1 喜欢2 你dtype: object 不过Series单独使用的比较少,我个人感觉,碰到的少,我们学习他主要是为

2022-07-13 11:10:16 510

原创 量化投资基础学习(2)————常用库 Scipy 函数 (2022.7.12)

Scipy提供了科学计算功能,如线性代数,优化,积分、差值、信号处理等,没错,他也是和numpy有关,他是基于numpy创造的。他有很多的数学包,一般我们引进的时候都是代码如下(示例): 刚在书上看到python的这个包可以导出Matlab的.mat文件,我在想是不是python和Matalib可以交互,但是我暂时对Matlab还没有研究过,过几去看看。 他们的实例代码如下 out:{'__header__': b'MATLAB 5.0 MA

2022-07-12 09:00:34 871

原创 量化投资基础学习(1)————常用库 numpy 函数 (2022.7.11)

numpy 对于我来说可以说是最熟悉不过得了,因为感觉哪都有他。数据分析 最为显著,所以他也被称为各种操作的基础。array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])numpy.ndarray(10,) 可以看到这里是一个一维...

2022-07-11 11:49:04 391

原创 【python】基础学习(2)

python基础

2022-07-04 16:30:20 1632

原创 sql sever 数据定义

sql sever 实验

2022-05-11 22:02:13 1634

原创 【python】基础学习(1)

python基础学习笔记

2022-04-28 23:14:50 674 1

原创 第十届泰迪杯C题第一问关于我的一些思路

读取文章数据获取停用词表合并2018-2019 和2020-2021的两张表去除停用词和一些数字,英文 空格有对文章的大意重要的关键词就相关,至于取前几关键词可依次分析最终结果如下写的代码过于丑陋就不发完整了,以上是本人一些第一题思路,也希望大家能在泰迪杯上取得好成绩。...

2022-04-19 22:17:38 1173 2

sql sever 基础练习

sql sever 数据定义 数据更新 数据查询 视图操作

2022-05-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除