自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 【机器学习实战】南非心脏病数据——基于逻辑回归

南非心脏病数据 SAheart包SAheart是R语言中的一个数据包,其中包含了南非心脏病数据集。该数据集提供了关于南非人口样本的心脏病相关的信息。南非心脏病数据集(South African Heart Disease Data)收集了一组有关心脏病风险因素的数据。该数据集由5个县的462个个体组成,其中包括了有关他们的年龄、性别、体重指数、收缩压、胆固醇水平等多个特征。该数据集的目的是研究这些风险因素与心脏病之间的关系。

2023-06-30 12:00:00 1697

原创 [机器学习入门】文本分析知识点汇总

词法分析包括分词、词性标注、命名实体识别和词义消歧。

2023-05-29 12:00:00 425 1

原创 在这个夏天,和对象用python看一次流星雨吧【Python绘制流星雨】

首先,定义一个类,表示星星,构造一个函数,在创建Star对象时被调用,之后设置星星的x和y坐标,使其随机分布在窗口内,接下来设置星星的速度,使其随机在1到3之间。使用黑色填充整个屏幕,清除上一帧的画面,更新并绘制所有的星星,更新屏幕显示,将绘制好的画面呈现给用户,使用Clock对象的tick方法来控制游戏循环的帧率,使其每秒运行60帧。设置类star的update方法,用于更新星星的状态,使星星沿y轴方向移动,如果星星移动到窗口下方,则将其重置到窗口顶部,并随机更新其x坐标、速度和颜色。

2023-04-25 09:06:21 1156

原创 【机器学习入门】文本分析基础概念与方法

为文本挖掘。通过对文本内部特征提取,获取隐含的语义信息或概括性主题,从而产生高质量的结构化信息,合理的文本分析技术能够获取作者的真实意图。

2023-04-24 12:00:00 2368 1

原创 【机器学习入门】一文看懂聚类分析以及常见方法

聚类分析是一种典型的无监督学习,用于对未知类别的样本进行划分,将它们按照一定的规则划分成若干个类簇,把相似(距离相近)的样本聚在同一个类簇中,把不相似的样本分为不同类簇,从而揭示样本之间内在的性质以及相互之间的联系规律。

2023-04-22 08:30:00 2517

原创 【MySQL入门】基础知识与DDL操作

在介绍完一些基础的概念之后,我们需要在自己的电脑上安装MySQL程序,大家可以在网络上自己寻找适合自己电脑的版本进行安装,安装并且配置好环境后我们就可以进行数据库的相关操作了。数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。该命令的作用: 如果数据库不存在则创建,存在则不创建。大家注意:最后一个字段后没有逗号!

2023-04-22 08:00:00 60

原创 机器学习:利用线性判别对种子进行分类并做可视化

线性判别分析(Linear Discriminant Analysis,LDA)是一种经典的统计学习方法,主要用于分类问题。它的原理基于贝叶斯决策理论,假设数据服从多元正态分布,并试图寻找一个能够最大化类间差异、同时最小化类内差异的线性投影方向,以实现对数据的分类。

2023-04-03 15:44:54 924

原创 python获取宁德时代数据,绘制回报率曲线分析发展状况

python获取电池行业巨头宁德时代的股票价格变化情况,一眼看到涨跌情况,并计算回报率做出数据可视化。

2023-03-27 13:36:15 845

原创 解决R语言wordcloud2不能自定义图形的问题

两步解决wordcloud2不能自定义词云图形状

2023-03-10 08:00:00 530 1

原创 不输入公式,直接对话便能处理表格!chatexcel了解一下

“chatGPT版”的excel,输入文字命令,自动执行,赶紧试试

2023-03-08 14:27:39 2302

原创 【机器学习入门】决策树算法(三):C5.0算法

C5.0算法是一种决策树模型,由J R Quinlan在C4.5算法的基础上改进而来,适用于处理大数据集。

2023-03-07 08:00:00 3668

原创 【机器学习入门】决策树算法(四):CART算法(Classification and Regression Tree)

CART(Classification and Regression Tree)算法,即分类回归树算法,也是决策树构建的一种常用算法。

2023-03-06 17:36:46 1691

原创 AIGC只知道Open AI?那可不行,这份名单,带你了解AIGC产业地图公司,看看还有那些公司已在圈内

AIGC产业地图标的公司列表(部分):数据服务:算法模型:应用拓展:

2023-02-18 15:14:32 291

原创 【机器学习入门】决策树算法(二):C4.5算法

C4.5算法是一种决策树学习算法,是ID3算法的改进版本。它与ID3算法类似,也是通过选择信息增益最大的特征构造决策树的模型,但是C4.5算法在信息增益的计算方法上做了一些改进。

2023-02-14 08:00:00 430

原创 【机器学习入门】决策树算法(一):ID3(Iterative Dichotomiser 3)算法

ID3是一种决策树学习算法,是一种机器学习技术,通过选择最优的特征,构造决策树模型来完成分类任务。

2023-02-06 08:00:00 1338

原创 【机器学习入门】解决过拟合的又一方法:交叉验证

在上一篇文章当中我们说到,可以使用正则化来解决过拟合问题,今天我们再来介绍另一种方法:交叉验证法。那么,什么是交叉验证呢?

2023-02-04 08:00:00 1313

原创 【机器学习入门】避免过拟合的方法之一:正则化

避免过拟合的方法比较多,但是较为常用的就是正则化。什么是正则化?正则化是如何避免过拟合的?正则化都有哪几种形式?还请一字一句看看

2023-02-01 18:15:00 733

原创 【机器学习入门】常用损失函数以及简介

一些损失函数的图像

2023-01-29 21:03:27 977

《机器学习及R语言应用》陈强 课后习题代码

本代码压缩包是陈强教授的《机器学习以及R语言应用》的课后习题答案,从第四章到第十八章所有课后习题代码均有包含,所有代码经本人亲自运行,均能正常运行出所需结果。 但,代码集当中的命名仅是作为示范,并非如此不可,大家可以自行更改自己认为合适的命名,根据自身需要可以自行更改。 另外,所需要的数据集需要大家自行从网站进行下载或者从电脑中进行读取本地文件,请先配置好本地工作环境再运行代码。 值得注意的是,由于R语言当中很多包已经进行更新,一些新的包不再具有以前旧版本包的功能,比如新版本的wordcloud2不再支持自定义词云图形状,需要安装旧版本的wordcloud2才能进行自定义,从而完成相关工作。 代码量较大,难免有些许错误,还望大家海涵,另外,希望本资源作为大家的参考,而并非标准答案,希望能够帮助到大家。

2023-03-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除