自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 k-means聚类算法学习笔记(案例分析、python代码,结果可视化)

K-Means算法是一种典型的基于划分的聚类算法,也是一种无监督学习算法。K-Means算法的思想很简单,对给定的样本集,用欧氏距离作为衡量数据对象间相似度的指标,相似度与数据对象间的距离成反比,相似度越大,距离越小。预先指定初始聚类数以及个初始聚类中心,按照样本之间的距离大小,把样本集划分为个簇根据数据对象与聚类中心之间的相似度,不断更新聚类中心的位置,不断降低类簇的误差平方和(Sum of Squared Error,SSE),当SSE不再变化或目标函数收敛时,聚类结束,得到最终结果。

2023-02-14 12:11:38 3860

原创 决策树模型学习笔记(案例分析、推算过程、python代码)

决策树(decision tree)是一类常见的机器学习方法.以二分类任务为例,我们希望从给定训练数据集学得一个模型用以对新示例进行分类,这个把样本分类的任务,可看作对 “当前样本属于正类吗?” 这个问题的“决策”或“判定〞过程.顾名思义,决策树是基于树结构来进行决策的。信息增益法和基尼指数法(CART决策树),此次我主要学习了通过计算数据集的基尼指数来构建决策树。

2023-02-13 15:18:08 1574

原创 大数据开发学习笔记

大数据开发有两种 , 一种需要编写Spark、Hadoop的应用程序 , 另一种需要开发大数据处理系统本身 。 大数据开发工程师的职责是负责公司大数据平台的开发和维护、网络日志大数据分析、实时计算和流式计算等技术的研发和网络安全业务主题建模等工作 。

2023-02-12 13:46:43 585

原创 马尔可夫模型实际运用(以金融领域为例)(python代码)

马尔可夫链(Markov Chain, MC)是概率论和数理统计中具有马尔可夫性质(Markov property)且存在于离散的指数集(index set)和状态空间(state space)内的随机过程(stochastic process)。适用于连续指数集的马尔可夫链被称为马尔可夫过程(Markov process),但有时也被视为马尔可夫链的子集,即连续时间马尔可夫链(Continuous-Time MC, CTMC)

2023-02-11 15:55:18 2845 4

原创 数据库导入excel文件失败

数据库(Navicat for MySql)导入excel文件失败在建立数据库表的时候,一个数据一个数据的输入显然是不现实的,非常的浪费时间,于是直接导入成为了高效便捷的方式,但是在导入途中会出现`导入格式错误`,或者`显示不了sheet栏`等问题,我是用下面这种方式解决的。

2022-10-31 14:34:00 1139

原创 电脑联上网,但是无法使用网络

电脑联上网,但是无法使用网络,当初本来想要fan qiang出去找一篇论文,然后就开了代理,可能是被拦截了?然后电脑就莫名其妙上不了网了,当时百度搜了很多,解决方法也千奇百怪,我当时是这样解决的。

2022-10-31 14:16:17 111

原创 Numpy基本语法的使用

使用numpy对鸢尾花数据进行`去重、求和、求均值、中值、最大值、最小值、极值、标准差、排序`

2022-10-31 13:49:31 70

原创 Python安装Talib库

python安装TA-Lib库。TA-Lib全称“Technical Analysis Library”, 即技术分析库,是Python金融量化的高级库,涵盖了150多种指标,包括股票、期货交易软件中常用的技术分析指标,如MACD、RSI、KDJ、动量指标、布林带等等,是一种高效便捷的金融量化分析库,在python中也可以轻松运用。

2022-10-31 13:18:58 15965 11

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除