机器学习算法
文章平均质量分 73
机器学习算法学习
周虽旧邦其命维新
剑气纵横三万里 一剑光寒十九洲
展开
-
tensorflow学习笔记一
当张量在gpu上运行时,就把内存中的numpy的内容拷贝一份到gpu的显存中,在gpu中做高速运算,这时如果用numpy方法读取它的值,就需要再从gpu的显存中拷贝到内存中,然后再以numpy数组的形式输出,因此速度会比较慢。当张量在cpu上运行时,张量和NumPy其实是共享同一段内存,只是读出和理解它的方式不同,因此这种情况下使用张量的numpy方法,可以非常快的得到结果。当对多维张量进行维度变换时,只是改变了逻辑上索引的方式,没有改变内存中的存储方式。加减乘除运算、幂运算、对数运算、矩阵运算等。原创 2022-12-13 12:28:57 · 629 阅读 · 1 评论 -
tensorflow学习环境安装
使用google colab需要谷歌账号,注册谷歌账号又一直提示手机号不可用,改浏览器语言换、手机号码什么的都试过不管用,和手机号码无关,而是翻墙软件的ip出口就那么多,谷歌做了每个ip申请账号的限制,最后通过手机下载qq邮箱添加gmail账号,创建账号成功申请到谷歌账号。cuda版本和nvidia显卡对应关系:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html#title-new-features。原创 2022-11-16 12:37:10 · 679 阅读 · 0 评论 -
集成学习与随机森林
集成学习(ensemble learning)是一类机器学习框架,通过构建并结合多个学习器来完成学习任务。一般结构是:先产生一组“个体学习器”,再用某种策略将它们结合起来。结合策略主要有平均法、投票法和学习法等集成学习包含三个典型算法:Bagging、Staking和Boostinghard voting投票soft voting投票虽然有很多的机器学习算法,但是从投票的角度看,依然不够多,我们希望有成百上千甚至上万的投票者,来保证投票结果的可信度。我们需要创建更多的子模型,集成更多子模型的意见。原创 2022-11-16 08:20:14 · 1083 阅读 · 0 评论 -
决策树算法
决策树是非参数学习算法,可以解决分类问题,天然可以解决多分类问题,也可以解决回归问题,有非常好的可解释性。编写PlotDecisionBoundary.py文件从决策边界图像可以看出,首先X小于2.4被划分为A类,其余数据被分做一类,然后y小于1.8被划分为B类,大于1.8被划分为C类。原创 2022-11-15 08:32:49 · 714 阅读 · 0 评论 -
支撑向量机
支持向量机(Support Vetor Machine,SVM)由Vapnik等人于1995年首先提出,在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并推广到人脸识别、行人检测和文本分类等其他机器学习问题中。SVM建立在统计学习理论的VC维理论和结构风险最小原理基础上,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳平衡,以求获得最好的推广能力。SVM可以用于数值预测和分类。原创 2022-11-11 13:47:40 · 1189 阅读 · 0 评论 -
分类准确度
假如有一个癌症预测系统,输入体检信息,可以判断是否有癌症,准确度为99.9%,这个系统是好还是坏?如果癌症产生的概率本来就只有0.1%,那么即使不采用此预测系统,对于任何输入的体检信息,都预测所有人都是健康的,即可达到99.9%的准确率。如果癌症产生的概率本来就只有0.01%,预测所有人都是健康的概率可达99.99%,比预测系统的准确率还要高,这种情况下,准确率99.9%的预测系统是失败的。。原创 2022-11-07 18:13:28 · 722 阅读 · 0 评论 -
逻辑回归算法
)# 使用线性模型逻辑回归预测# 添加多项式项预测# degree=20时发生了过拟合,需要进行模型正则化。原创 2022-11-04 21:30:04 · 1506 阅读 · 0 评论 -
多项式回归与模型泛化
欠拟合是指模型不能在训练集上获得足够低的误差。换句换说,就是模型复杂度低,模型在训练集上就表现很差,没法学习到数据背后的规律。原创 2022-11-03 08:31:09 · 824 阅读 · 0 评论 -
PCA与梯度上升法
假设存在一根直线,将所有的点都映射在该条指直线上,这样的话点的整体分布和原来的点的分布就没有很大的差异(点和点的距离比映射到x轴或者映射到y轴都要大,区分度就更加明显),与此同时所有的点都在一个轴上(理解成一个维度),虽然这个轴是斜着的。用这种方式将二维降到了一维度那么如何找到这个让样本间距最大的轴?如何定义样本间间距?使用方差(Variance)方差越大代表样本之间越稀疏,方差越小代表样本之间越紧密。原创 2022-11-01 16:05:17 · 288 阅读 · 0 评论 -
梯度下降法学习笔记
梯度下降法原创 2022-10-28 17:44:49 · 929 阅读 · 1 评论 -
线性回归法学习笔记
所要求得的结果是一个具体的数值,而不是一个类别的话,则该问题是回归问题。只有一个特征的回归问题,成为。两个变量之间存在一次方函数关系,就称它们之间存在线性关系。就是把平面上一系列的点,用一条光滑的曲线连接起来。原创 2022-10-27 13:33:57 · 667 阅读 · 0 评论 -
k近邻算法学习笔记
scikit-learn中的knn算法3、手写代码模拟knn算法编写KNN.py模拟scikilearn中的knn算法预测过程:使用自定义的预测方法预测鸢尾花类型:4、模拟数据集拆分编写model_selection.py文件,模拟scikilearn中knn算法数据集测试:5、封装准确度方法编写metrics.py在KNN.py文件中添加score方法调用metrics.py中的accuracy_score来计算准确度使用手写数字识别数据集测试准确度方法:6、超参数6.1原创 2022-10-25 08:37:21 · 316 阅读 · 0 评论