机器学习之python
文章平均质量分 90
带我去滑雪
Statistical Learning
如有任何问题,欢迎私信!
展开
-
文本情绪指数与上证指数的VAR模型构建
文本情绪指数与上证指数的VAR模型构建原创 2024-06-28 16:23:54 · 477 阅读 · 1 评论 -
利用python爬取上证指数股吧评论并保存到mongodb数据库
主要解决爬取上证指数股吧评论问题,后续可能会对评论进行数据处理和情感分析。原创 2024-06-28 14:34:20 · 397 阅读 · 0 评论 -
Python+MongoDB的文档管理系统
文档管理系统(Python+MongoDB)为用户提供了高度的定制性和灵活性,使其成为一个非常有吸引力的选择。这种组合允许开发者创建一个完全根据他们的特定需求、工作流程和数据管理要求量身定制的解决方案。通过使用Python,开发者可以利用其简洁的语法和强大的库生态系统快速开发应用程序,而MongoDB的非关系型数据模型则提供了存储灵活性和高性能的读写操作,这对于处理大量的文档和元数据尤其重要,并且MongoDB是免费。原创 2024-04-11 17:41:45 · 573 阅读 · 0 评论 -
python绘制子图(旭日图、渐变堆积面积图、多数据折线图、比例关系图)
子图可以更清晰地展示和理解复杂的数据关系,通过将数据分成多个小图,有助于观察数据间的关系和趋势。减少数据之间的重叠和混淆,使得每个子图更易于理解和解释。不同类型的子图可以呈现数据的不同方面。例如,旭日图可以展示层次数据的结构,渐变堆积面积图可以显示时间序列数据的变化,多数据折线图可以比较多个数据集的趋势,比例关系图可以展示数据之间的相对比例关系。下面开始代码实战。原创 2024-04-06 11:42:31 · 573 阅读 · 0 评论 -
基于word2vec+LSTM模型实现百度贴吧恶意评论预测
基于word2vec+LSTM模型实现百度贴吧恶意评论预测原创 2024-03-25 15:14:26 · 1176 阅读 · 0 评论 -
使用决策树模型绘制混淆矩阵、ROC曲线、特征变量重要性排序图
决策树模型可以处理各种类型的特征(连续型、离散型、类别型等),不需要对特征进行过多的预处理工作,因此非常适合初步探索数据。通过绘制混淆矩阵、ROC曲线和特征变量重要性排序图,可以直观地了解模型的性能表现以及对于预测的重要特征,有助于进一步分析和改进模型。下面开始代码实战。原创 2024-03-18 21:01:22 · 1628 阅读 · 2 评论 -
使用逻辑回归绘制混淆矩阵、ROC曲线、特征变量重要性排序图
逻辑回归是一种用于解决分类问题的统计学习方法,它常被用于二分类问题,即将数据分为两个类别。逻辑回归的目标是根据输入的特征来预测输出为某个类别的概率。逻辑回归模型在简单性、可解释性、稳定性和性能评估等方面具有优势,并且可以通过绘制混淆矩阵、ROC曲线和特征变量重要性排序图来进一步评估和优化模型。下面开始代码实战。原创 2024-03-18 21:21:38 · 840 阅读 · 0 评论 -
基于粒子群优化的支持向量机房价预测分析
在本期中,首先介绍如何爬取房价数据与清洗数据,对处理后的数据进行简单分析,最后使用粒子群优化的支持向量机对房价进行预测。原创 2024-03-14 11:12:02 · 1184 阅读 · 0 评论 -
小波神经网络的时间序列预测——短时交通流量预测
利用小波神经网络实现短时交通流量预测。原创 2023-11-15 11:43:39 · 1729 阅读 · 0 评论 -
自组织竞争网络在模式分类中的应用——患者癌症发病预测
自组织神经网络可以通过对客观事件的反复观察、分析与比较,自行提示内在规律,并对具有共同特征的事物进行正确的分类。该网络更与人脑中生物神经网络的学习模式类似,即可以通过自动寻找样本中的内在规律和本质属性,自组织、自适应地改变神经网络参数结构。自组织神经网络的学习规则大都采用竞争型的学习规则。原创 2023-11-14 21:51:43 · 198 阅读 · 0 评论 -
基于连续Hopfield神经网络优化——旅行商问题优化计算
由于连续型Hopfield神经网络具有优化计算的特性,因此将TSP问题的目标函数(即最短路径)与网络的能量函数相对应,将经过的城市顺序与网络的神经元状态相对应。这样,由连续型Hopfield神经网络的稳定性定理知,当网络的能量函数趋于最小值时,网络的神经元状态也趋于平衡点,此时对应的城市顺序即为最佳的路线。原创 2023-11-13 21:50:55 · 1030 阅读 · 0 评论 -
基于BP神经网络+Adaboost的强分类器设计实现公司财务预警
BP神经网络+Adaboost模型就是把BP神经网络作为弱分类器,反复训练BP神经网络预测样本输出,最后通过Adaboost算法将多个BP神经网络弱分类器组合成强分类器。原创 2023-11-09 14:36:00 · 543 阅读 · 1 评论 -
使用遗传算法优化BP神经网络实现非线性函数拟合
使用遗传算法优化的BP神经网络实现非线性函数拟合原创 2023-11-08 18:37:09 · 1592 阅读 · 0 评论 -
BP神经网络的数据分类——语音特征信号分类
使用BP神经网络进行语音特征信号分类原创 2023-11-07 21:33:42 · 1459 阅读 · 1 评论 -
密度聚类与层次聚类
密度聚类(Density-based Clustering)和层次聚类(Hierarchical Clustering)是两种不同的聚类方法,用于将数据集中的数据点分组成簇。原创 2023-11-07 17:25:50 · 559 阅读 · 0 评论 -
多变量GARCH模型R代码实现
多变量GARCH(Generalized Autoregressive Conditional Heteroskedasticity)模型是一种用于建模多个时间序列变量之间的条件异方差性(conditional heteroskedasticity)的统计模型。原创 2023-10-24 19:02:18 · 617 阅读 · 1 评论 -
利用逻辑回归判断病人肺部是否发生病变
判断肺部是否发生病变可以及早发现疾病、指导治疗和监测疾病进展,以及预防和促进肺部健康,定期进行肺部评估和检查对于保护肺健康、预防疾病和提高生活质量至关重要。本期将利用相关医学临床数据结合逻辑回归判断病人肺部是否发生病变原创 2023-08-28 19:14:30 · 992 阅读 · 0 评论 -
利用多种机器学习方法对爬取到的谷歌趋势某个关键词的每日搜索次数进行学习
前一期利用python爬取了谷歌趋势某个关键词的每日搜索次数,本期利用爬取的数据进行多种机器学习方法进行学习,其中方法包括:随机森林、XGBOOST、决策树、支持向量机、神经网络、K邻近等方法,并对模型拟合效果进行对比。原创 2023-08-28 00:52:32 · 381 阅读 · 0 评论 -
利用python爬取谷歌趋势某个关键词的每日搜索次数
本期尝试利用python爬取谷歌趋势某个关键词的每日搜索次数。原创 2023-08-27 14:34:49 · 1810 阅读 · 0 评论 -
python实现随机森林的特征变量重要性排序
随机森林的特征变量重要性排序在特征选择和特征分析中具有广泛的用途。它可以用来识别哪些特征对目标变量的预测最为重要,从而帮助我们理解数据中的关键特征和影响因素。原创 2023-07-23 12:18:10 · 3927 阅读 · 1 评论 -
Matlab中实现对一幅图上的局部区域进行放大
局部放大图可以展示图像中的细节信息,使图像更加直观和精美,此次使用magnify工具实现对绘制的figure选择区域绘制原创 2023-07-22 21:51:21 · 2271 阅读 · 0 评论 -
回顾分类决策树相关知识并利用python实现
决策树(Decision Tree)是一种基本的分类与回归方法,呈树形结构,在分类问题中,表示预计特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点(node)和有向边(directed edge)组成。原创 2023-07-01 20:19:20 · 2758 阅读 · 0 评论 -
python实现基于SVD矩阵分解的电影推荐系统设计
本期利用抓取IMDB的英文网站上的电影相关数据,实现基于SVD矩阵分解的电影推荐系统设计。原创 2023-06-29 13:14:49 · 2472 阅读 · 0 评论 -
python数据分析之利用多种机器学习方法实现文本分类、情感预测
本期首先利用python抓取百度贴吧中的评论获得文本数据,再对文本数据进行中文分词、数据清洗、特征提取、TF-IDF权重计算等数据预处理,再进行一定的数据分析和数据可视化,最后运用朴素贝叶斯、神经网络、支持向量机、随机森林、逻辑回归、K近邻、决策树、梯度提升共计8种机器学习对文本数据进行分类。原创 2023-06-28 17:29:04 · 10150 阅读 · 12 评论 -
机器学习之分类决策树与回归决策树—基于python实现
介绍分类决策树与回归决策树案例原创 2023-05-02 20:38:46 · 3693 阅读 · 0 评论 -
机器学习之惩罚回归—基于python实现(附完整代码)
本期为大家介绍惩罚回归,分别从以下几个方面着手:为什么会有惩罚回归?什么是惩罚回归?常见的惩罚回归有哪些?惩罚回归的python代码如何实现?我相信解决好这些问题,就已经基本能够掌握惩罚回归的很多知识。原创 2023-04-22 22:35:13 · 2119 阅读 · 4 评论 -
机器学习之利用SMO算法求解支持向量机—基于python
本期将讨论支持向量机的实现问题,我们知道支持向量机的学习问题可以化为求解凸二次规划问题。这样的凸二次规划问题具有全局最优解,并且有许多最优化算法可以用于这一问题的求解。但是当训练样本容量很大时,这些算法往往变得非常低效,以致无法使用。所以,如何高效地实现支持向量机学习就成为一个重要的问题。目前人们已提出许多快速实现算法。本期讲述其中的序列最小最优化(sequential minimal optimization, SMO)算法。原创 2023-04-20 00:17:20 · 1752 阅读 · 0 评论 -
机器学习之主成分分析建模
本期介绍一种常见的非监督学习方法,即主成分分析。对于非监督学习,其数据中只含有特征变量x,而没有响应变量y。因此非监督学习的目标并非用x预测y,而是探索特征变量x本身的规律和模式。主成分分析是统计学中进行降维的经典方法,该降维的思想是将多个高度相关的特征变量转换为几个不存在线性关系的特征变量,转置后的变量称为主成分,每个主成分都是原始特征变量的线性组合,主成分可以反映原始数据的大部分信息,从而达到简化系统结构,抓住问题实质。一般特征变量个数太多或存在严重的多重共线性时,可以使用主成分分析对自变量进行处理,在原创 2023-04-09 20:47:00 · 1872 阅读 · 1 评论 -
机器学习之判别分析全过程建模—基于python
判别分析全过程建模、线性判别分析、二次判别分析原创 2023-04-09 14:10:28 · 1285 阅读 · 0 评论 -
机器学习之多分类问题的支持向量机—基于python
本期使用UCIMachine Learning Repository 的液体超声波流量计(liquid ultrasonic flowmeter)数据Meter_D.csv,进行多分类问题的SVM估计。其中V44为响应变量,表示流量计的四种不同状态(1为Healthy,2为Gas injection,3为Installation effects,4为Waxing)。V1-V43为流量计的一系列度量指标,均为数值型变量。研究目的是根据这些指标判断流量计的质量状况。原创 2023-04-02 00:57:14 · 2988 阅读 · 22 评论 -
机器学习之支持向量回归(SVR)预测房价—基于python
本期使用爬取到的有关房价数据集data.csv,使用支持向量回归(SVR)方法预测房价。该数据集中“y1”为响应变量,为房屋总价,而x1-x9为特征变量,依次表示房屋的卧室数量、客厅数量、面积、装修情况、有无电梯、、房屋所在楼层位置、有无地铁、关注度、看房次数共计9项。数据集data.csv可在文末获取。原创 2023-04-01 18:00:38 · 11205 阅读 · 22 评论 -
机器学习之判别分析建模—基于python
本期使用UCI Machine Learning Repository 的小麦种子数据 seeds_dataset.csv 进行判别分析。该数据集中,变量“Class”为响应变量,取值为1,2,3,表示三种不同类型的小麦种子,变量V1-V7 均为数值型特征变量,为根据X光技术得到的麦粒几何性质,比如面积、周长、宽度等。该数据需要提前下载并放置python工作路径,数据可去文末获取。原创 2023-04-01 00:12:41 · 1598 阅读 · 7 评论