机器学习
文章平均质量分 93
笔触狂放
有扎实的java基础 精通android studio使用 熟练使用Http协议,以及各种框架 熟练sqlite,mysql,SQL Server数据库使用 有良好的编程风格及独立开发项目的能力 熟练使用okHttp框架、RxJava框架、RxAndroid框架、butterknife框架、picasso框架、imgaeLoader框架、Volley框架 熟练使用单例模式,工厂模式,观察者模式,策略模式等 熟练掌握html,css3,javaScript,jsp,servlet技术,SSM框架 有扎实的Python基础 熟悉urllib库 熟悉MVC,MVP架构 熟练使用django框架
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【机器学习】综合实训(二)
本文介绍了两个机器学习实战项目:电影评分预测和客户流失预测。电影评分预测项目使用MovieLens数据集,通过协同过滤算法构建推荐系统,包含数据探索、稀疏矩阵处理、模型评估等完整流程,重点解决冷启动问题。客户流失预测项目基于电信行业数据,应用逻辑回归、决策树、随机森林等算法进行分类预测,涵盖特征工程、不平衡数据处理和模型优化等关键环节。两个项目均提供详细的数据可视化、多种算法比较和模型性能评估(如RMSE、准确率、ROC-AUC等指标),并包含实际预测功能,展示了从数据预处理到模型部署的完整机器学习流程。原创 2025-09-07 19:34:56 · 984 阅读 · 0 评论 -
【机器学习】综合实训(一)
本文介绍了四个机器学习实践项目:1. 鸢尾花分类:使用scikit-learn实现决策树分类器,包含数据加载、模型训练与评估,准确率达100%。扩展了数据预处理、交叉验证和Pipeline整合流程。2. 手写数字识别:基于MNIST数据集构建CNN模型,包含卷积层、池化层和全连接层,实现图像加载、训练和可视化评估。3. 房价预测:采用加州房价数据集,使用线性回归、随机森林等算法,包含EDA、特征工程和模型优化,评估指标包括RMSE和R²。4. 垃圾邮件分类:基于Spambase数据集,实现朴素贝叶斯、SVM原创 2025-09-07 19:25:50 · 1164 阅读 · 0 评论 -
【机器学习】第九章 综合实战
本文介绍了机器学习中的管道模型及其应用,重点讲解了Pipeline类如何封装数据预处理、特征选择和模型训练等步骤,避免交叉验证中的预处理错误。同时详细阐述了文本数据处理方法,包括sklearn和NLTK库的分词、停止词处理、词干提取和词性标注等技术。最后以泰坦尼克号数据集为例,展示了数据清洗、特征分析和建模的完整流程。文章强调了管道模型在简化机器学习流程中的重要性,并提供了从理论到实践的综合指导。原创 2025-07-28 15:46:28 · 1222 阅读 · 0 评论 -
【机器学习】第八章 模型评估及改进
本文系统探讨了机器学习模型评估与改进的核心方法。首先介绍了交叉验证技术,包括K折交叉验证、分层K折交叉验证、留一交叉验证等,对比分析了不同方法的适用场景和优缺点。其次详细讲解了网格搜索原理,通过参数组合优化提升模型性能,并强调结合交叉验证防止过拟合的重要性。然后全面阐述了分类和回归问题的评估指标体系:对于分类问题,重点解析了精度、准确率、召回率、F值等核心指标,以及PR曲线、ROC曲线等可视化评估工具;对于回归问题,则介绍了R方系数、均方误差等关键指标。最后指出模型评估需要综合多种指标,不仅要关注数值表现,原创 2025-07-28 15:35:52 · 1004 阅读 · 0 评论 -
【机器学习】第七章 特征工程
本文系统介绍了机器学习中的特征工程关键技术,包括特征提取、特征选择和降维方法。首先阐述了数据预处理的必要性,强调特征工程对模型性能的决定性作用。在特征提取部分,详细讲解了字典特征提取(使用DictVectorizer)、文本特征提取(词袋模型、N-Grams、TF-IDF)和图像特征提取(灰度/彩色图像处理)的具体实现方法。特征选择部分介绍了Filter(方差过滤、相关性检验)、Wrapper(递归特征消除)和Embedded(基于L1和随机森林)三种方法。降维部分重点讲解了PCA原理及实现,并对比了ICA原创 2025-07-27 15:27:01 · 1165 阅读 · 0 评论 -
第六章 数据预处理
摘要:本文系统介绍了机器学习中的数据预处理方法,主要包括数据清洗、数据变换和数据归约三大类。在数据清洗方面,详细阐述了缺失值处理的三种方法(直接使用、删除和补全)以及异常值检测的标准差法和分位差法。数据变换部分涵盖了无量纲化、归一化、离散化、分类特征编码(包括one-hot编码和LabelEncoder)以及多项式特征生成等技术。数据归约则介绍了属性归约(如PCA)和数值归约方法。文章通过Python代码示例展示了各种预处理技术的具体实现,并强调了数据预处理对提高模型性能的重要作用。最后,通过习题形式总结了原创 2025-07-27 08:00:00 · 995 阅读 · 0 评论 -
【机器学习】第五章 聚类算法
在前文介绍的分类算法中,如果所有训练数据都有标签,则为有监督学习算法;如果数据没有标签,显然就是无监督学习算法了,即聚类算法。在监督学习中,分类算法的效果还是不错的,但相对来讲,聚类算法就有些“惨不忍睹”了。确实,无监督学习算法本身的特点使其难以得到如分类算法一样近乎完美的结果。在无监督学习算法中,我们基本不知道结果会是什么样子的,但可以通过聚类的方式从数据中提取一个特殊的结构,进行探究性研究,寻找各种方法。原创 2025-07-22 14:04:39 · 1505 阅读 · 0 评论 -
【机器学习】第四章 回归算法
第3章对分类算法进行了介绍,接下来介绍回归算法。回归算法是种根据数据构建模型,再利用这个模型训练其中的数据并进行处理的算法,训练得到的是样本特征与样本标签之间的映射,样本标签是连续的。回归算法以线性模型为主。线性模型指的不是一个模型,而是一类模型,包括线性回归、岭回归、LASSO回归等。原创 2025-07-22 13:54:14 · 1176 阅读 · 0 评论 -
【机器学习】第三章 分类算法
现在天气预测越来越准确,预测的时间甚至可以精确到某时某分。我们知道,天气预测是气象台通过卫星对云层进行观察,分析天气图,并结合地形、气候等因素总结而来的。而通过机器学习也能够对事物进行预测,例如根据历年股票数据,对股票价格趋势进行预测。而对以上这些情况的预测,并不是每次都很准确,原因往往有两个,一是数据本身处理不当,二是算法选择上的失误。那对于不同的问题,应该选择何种算法呢?原创 2025-07-17 15:10:52 · 1215 阅读 · 0 评论 -
【机器学习】第二章 Python入门
随着人工智能的发展,很多人想学习机器学习,那么究竟选择什么语言呢?在信息发达、语言众多的情况下,我们为什么选择Python?根据数据分析,机器学习中使用得最多的语言就是Python。Python一般来说 没有C语言运行速度快,又没有R语言开发速度快,为什么还能占据使用量的榜首呢?接下来让我们了解一下Python语言。原创 2025-07-15 16:10:16 · 1549 阅读 · 1 评论 -
【机器学习】第一章 概述
如今,智能手机已经很普遍了。大多智能手机都有语音助手,当我们向它提问题时,它可以轻松地解答,甚至还能像人一样和我们聊天。那么你有没有想过,智能手机又不是人,为什么能与人进行对话呢?这就与本书介绍的机器学习(machinelearning)有关。语音识别是机器学习领域中的一个新兴领域,通过自然语言处理(自然语言处理,NLP)识别语音,然后利用机器学习算法将语音转化为数字信息,并做出回应。自然语言处理是人工智能的一大重要领域,本书不做深入讲解,有兴趣的读者可自行查阅资料。原创 2025-07-15 14:33:15 · 998 阅读 · 0 评论
分享