![](https://img-blog.csdnimg.cn/eb675d9b7ca94e3293bb6c475e28a6d3.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
机器学习
文章平均质量分 94
主要记录一些机器学习相关的算法和案例~
心无旁骛~
百度飞桨星河社区中级精品作者、2023年度文心卓越贡献奖,在校期间获国家级奖项7项、省级奖项10余项,申请发明专利一项、科研项目四项,成功发表SCI2区论文一篇,中文普刊一篇,欢迎大家一起学习交流~
展开
-
大学生毕业设计——微博情感分析系统
系统分别尝试了基于情感词典的情感分析方法、基于朴素贝叶斯的情感分析方法以及基于BERT的情感分析方法,最终系统算法采用的是基于BERT的情感分析方法,因为整体对比下来,基于BERT的情感分析最为准确以及稳定。原创 2024-06-11 18:11:05 · 1237 阅读 · 0 评论 -
【Datawhale】AI夏令营第三期——基于论文摘要的文本分类笔记(上)
BERT,是一个经典的深度学习、预训练模型。2018年,由 Google 团队发布的论文《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》提出了预训练模型 BERT(Bidirectional Encoder Representations from Transformers),在自然语言处理领域掀起了巨大浪潮。原创 2023-08-30 15:52:46 · 579 阅读 · 0 评论 -
python机器学习数据建模与分析——数据预测与预测建模
机器学习的预测建模在多个领域都具有重要的应用价值,包括个性化推荐、商品搜索、自动驾驶、人脸识别等。本篇文章将带领大家了解什么是预测建模原创 2023-04-11 11:43:32 · 5814 阅读 · 1 评论 -
python机器学习——朴素贝叶斯算法笔记详细记录
朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBM)。和决策树模型相比,朴素贝叶斯分类器(Naive Bayes Classifier 或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。原创 2023-03-30 19:27:07 · 752 阅读 · 2 评论 -
python机器学习课程——决策树全网最详解超详细笔记附代码
决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。决策树方法最早产生于上世纪60年代,到70年代末。由J Ross Quinlan提出了ID3算法,此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。C4.5算法在ID3算法的基础上进行了改进,对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进,既适合于分类问题,又适合于回归问题。决策树算法构造决策原创 2023-03-26 19:52:17 · 3520 阅读 · 1 评论 -
python机器学习数据建模与分析——决策树详解及可视化案例
你是否玩过二十个问题的游戏,游戏的规则很简单:参与游戏的一方在脑海里想某个事物,其他参与者向他提问题,只允许提20个问题,问题的答案也只能用对或错回答。问问题的人通过推断分解,逐步缩小待猜测事物的范围。决策树的工作原理与20个问题类似,用户输人一系列数据,然后给出游戏的答案。我们经常使用决策树处理分类问题,近来的调查表明决策树也是最经常使用的数据挖掘算法。它之所以如此流行,一个很重要的原因就是使用者基本上不用了解机器学习算法,也不用深究它是如何工作的。原创 2023-03-21 17:48:59 · 3383 阅读 · 0 评论 -
机器学习数据预处理——归一化(Normalization)和标准化(standardlization)
数据的归一化和标准化是特征缩放featurescalingfeaturescaling的方法,是数据预处理的关键步骤。不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据归一化/标准化处理,以解决数据指标之间的可比性。原始数据经过数据归一化/标准化处理后,各指标处于同一数量级,适合进行综合对比评价。原创 2023-02-28 16:45:28 · 5805 阅读 · 0 评论 -
机器学习基础——k-近邻算法概述和简单实现
众所周知,电影可以按照题材分类,然而题材本身是如何定义的?由谁来判定某部电影属于哪个题材?也就是说同一题材的电影具有哪些公共特征?这些都是在进行电影分类时必须要考虑的问题。没有哪个电影人会说自己制作的电影和以前的某部电影类似,但我们确实知道每部电影在风格上的确有可能会和同题材的电影相近。那么动作片具有哪些共有特征,使得动作片之间非常类似,而与爱情片存在着明显的差别呢?动作片中也会存在接吻镜头,爱情片中也会存在打斗场景,我们不能单纯依靠是否存在打斗或者亲吻来判断影片的类型。原创 2023-01-16 13:15:55 · 580 阅读 · 2 评论 -
人工智能入门基础概念—教你正确打开人工智能世界的大门
人工智能(Artificial Intelligence),是一个以计算机科学(Computer Science)为基础,由计算机、心理学、哲学等多学科交叉融合的交叉学科、新兴学科,研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等原创 2023-01-16 11:51:03 · 2260 阅读 · 2 评论 -
论文的正确打开方式—如何细读一篇论文分享
学习论文是一个系统性的工程,如何更高效地阅读论文,并通过论文熟悉某个方向领域呢?这就需要合理的学习路径第一点,基础必不可少。这里总结了必备的基础知识,我们来看一下1、Python基础:这是毋庸置疑的必备基础,我们后边代码实现就是基于python语言2、数学基础:包含矩阵计算、概率论和信息论,矩阵计算在CV领域是必备知识,概率论与信息论在NLP中也是常见的概念。原创 2023-01-15 14:38:38 · 820 阅读 · 2 评论 -
波士顿房价预测—随机梯度下降法优化
使用随机梯度下降法(SGD)来优化基于numpy的波士顿放假预测案例。根据我上一篇关于一文可以知道,如果使用梯度下降法,需要将所有的样本对梯度的贡献取平均,根据梯度更新参数。但是面对海量样本的数据集,如果每次计算都使用全部的样本来计算损失函数和梯度,性能会很差,也就是计算的会慢。原创 2023-01-13 19:07:02 · 869 阅读 · 4 评论 -
使用Paddle飞桨重写波士顿房价预测案例
当读者使用飞桨框架编写多个深度学习模型后,会发现程序呈现出“八股文”的形态。即不同的程序员、使用不同模型、解决不同任务的时候,他们编写的建模程序是极其相似的。虽然这些设计在某些“极客”的眼里缺乏精彩,但从实用性的角度,我们更期望建模者聚焦需要解决的任务,而不是将精力投入在框架的学习上。因此使用飞桨编写模型是有标准的套路设计的,只要通过一个示例程序掌握使用飞桨的方法,编写不同任务的多种建模程序将变得十分容易。原创 2023-01-12 12:02:16 · 1157 阅读 · 6 评论 -
波士顿房价预测——机器学习入门级案例
在机器学习和深度学习过程中,往往要将数据集划分为训练集和测试集两部分,训练集用来进行训练,一般会取数据集的80%-90%,而测试集用来对训练好的模型性能进行评估,一般只取少量数据集,大概为10%左右。波士顿房价预测数据集中原有数据集为506行,经过划分以后,训练集为原来的80%,即404,测试集为原来的20%,即102。其中的X就是数据集介绍中的CRIM-LSTAT部分,而Y就是MEDV,即同类房屋价格的中位数,也就是我们后面要预测的值。函数成员forward。原创 2023-01-11 19:59:23 · 4846 阅读 · 7 评论