ai
功夫猫熊yeah
吃瓜群众
展开
-
ModuleNotFoundError: No module named ‘xxx‘ 问题解决
遇到这个问题我发现我导入的utils这个pacakge是有的,那就有可能是因为使用了main函数,导致找不到路径了,于是加入了如下代码,在开头,把项目根目录加进来。这个问题发生的主要原因,我搜索网络,大概意思就是在py文件中使用了__main__函数,破坏了什么路径识别什么的,原创 2023-07-29 14:50:57 · 585 阅读 · 0 评论 -
ubuntu 搭建深度学习开发环境
安装nvida显卡驱动 安装cuda 安装cudnn。nvida 驱动和cuda对应表。显示的内容太少,或者不显示,下载pycharm的地址。原创 2022-08-23 23:19:00 · 225 阅读 · 0 评论 -
spark trouble-shooting之Reference ‘temp‘ is ambiguous, could be
查看dataframe的可以发现temp列有两列,所以在运行时候报如下错误:这里是引用Caused by: org.apache.spark.sql.AnalysisException: Reference ‘temp’ is ambiguous, could be: temp, temp.;at org.apache.spark.sql.catalyst.expressions.package$AttributeSeq.resolve(package.scala:259)at org.apa原创 2021-08-26 08:01:18 · 1159 阅读 · 1 评论 -
机器学习18-局部加权线性回归
局部加权线性回归1、回归和特性的关系回头来看知识点二,左图的拟合效果为underfitting(欠拟合),数据中的明显的结构关系没有被模型所捕获。右图的拟合效果为overfitting(过拟合),这种模型只是用于特定的数据,预测效果不好。中图的效果最好,那如何选择特征,使得模型的效果最好?有些数据集可能涉及到成千上万个特征,如同知识点二,挨个试一试的方式显然是不可能的。从知识点二可以看出来,...原创 2019-08-15 11:09:07 · 359 阅读 · 0 评论 -
对数变化处理重尾分布
对于具有重尾分布的正数值的处理,对数变换是一个非常强大的工具。(与高斯分布相比,重尾分布的概率质量更多地位于尾部。)它压缩了分布高端的长尾,使之成为较短的尾部,并将低端扩展为更长的头部。...原创 2019-08-14 17:29:42 · 964 阅读 · 0 评论 -
机器学习相关论文
机器学习,一个刷论文的网站,推荐一下原创 2019-08-19 17:48:34 · 2177 阅读 · 0 评论 -
一个不错开源AI机器学习手册
在网上看了华校专的网站不错,下面是他的介绍作者华校专,曾任阿里巴巴资深算法工程师、智易科技首席算法研究员,现任腾讯高级研究员,《Python 大战机器学习》的作者。这是作者多年以来学习总结的笔记,经整理之后开源于世。目前还有约一半的内容在陆续整理中,已经整理好的内容放置在此。曾有出版社约稿,但是考虑到出版时间周期较长,而且书本购买成本高不利于技术广泛传播,因此作者采取开源的形式。笔记内容仅...原创 2019-08-01 15:08:20 · 145 阅读 · 0 评论 -
机器学习15-Bagging学习方法
知识点十五:Bagging学习方法Bagging这个单词,是根据Bootstrap Aggregation这个词组创造的一个新词。Bootstrap, 即拔靴带,是指穿长筒靴时用来帮助提靴的一个纽带,位于靴子后面。统计学上的Bootstrap一般称为自助法,是指从n个训练样本中随机选取n个,允许重复,生成与原始的训练样本集有些许差异的样本集的方法。像拔靴带那样的,只依靠自己就可以完成穿靴的...原创 2019-08-05 15:34:46 · 247 阅读 · 0 评论 -
机器学习14-Logistic回归
知识点十四:Logistic回归(非线性回归)1、什么是线性回归用一条直线对训练数据进行拟合的过程,叫做回归。这条直线成为称为:最佳拟合直线。2、Logistic回归Logistic回归的目的是寻找一个非线性函数Sigmoid的最佳拟合参数(注意:logistic回归正好是知识点一:《函数公式是怎么来的?》的一种照应),求解过程可以由最优化算法来完成。在最优化算法中,最常用的就是梯度上升算...原创 2019-08-05 15:31:16 · 138 阅读 · 0 评论 -
机器学习13-方向导数、梯度
知识点十三:方向导数、梯度1、曲面与空间坐标2、方向导数导数反映的是函数沿坐标轴方向的变化率,而在空间几何里面,方向导数反映的是曲面函数沿任一指定方向的变化率问题。曲面上的某一点(x0,y0,z0)会有一个切平面,切平面上的无数条直线都是过这一点的切线,这些切线的斜率实际上就是过这一点的无数个方向导数的值,和一元函数一样,方向导数的值实际反映了多元函数在这一点沿某个方向的变化率。正如下山...原创 2019-08-05 15:27:50 · 259 阅读 · 0 评论 -
机器学习12-Sigmoid函数的认识
1、初步认识:符号函数网上关于Sigmoid函数的介绍有很多,但是我感觉可以不用费心去研究。只要明白一点:Sigmoid函数是一个符号函数,它可以将变量映射到0,1之间。Sigmoid函数的公式如下所示:注意:要深度的理解Sigmoid函数是符号函数即可。2、深度认识:斜率和导数Sigmoid函数的定义如下:其中,x0表示了函数曲线的中心(sigmoid midpoint),k是曲线...原创 2019-08-05 15:25:40 · 2008 阅读 · 0 评论 -
机器学习11-朴素贝叶斯分类器
知识点十一:朴素贝叶斯分类器之所以称之为“朴素”,是因为整个形式化过程只做最原始、最简单的假设。这些假设包括:(1)各个特征之间相互独立。(2)每个特征同等重要。...原创 2019-08-05 15:23:14 · 104 阅读 · 0 评论 -
机器学习10-熵的与决策树
知识点十:熵的与决策树1、熵的起源,熵的计算信息论最初所处理的问题是数据压缩与传输领域中的问题,其处理方法利用了熵和互信息等基本量,它们是通信过程的概率分布的函数。2、信息增益的计算(摘自网络)在划分数据集之前之后信息发生的变化称为信息增益。举一个的例子:对游戏活跃用户进行分层,分为高活跃、中活跃、低活跃,游戏A按照这个方式划分,用户比例分别为20%,30%,50%。游戏B按照这种方式...原创 2019-07-31 19:21:30 · 191 阅读 · 0 评论 -
机器学习9-K近邻算法工作原理
知识点九:K近邻算法工作原理1、工作原理介绍存在一个训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前K个最相似的数据,这就是K近邻算法中K的出处,通常K是不大于20的整数。最后,选择K个...原创 2019-07-31 19:14:41 · 269 阅读 · 0 评论 -
机器学习8-什么是机器学习?
1、机器学习的定义(1)机器,指的是计算机。(2)学习,指的是:如果一个系统能够通过执行某个过程而改进性能,这就是学习。2、机器学习的套路机器学习=模型+策略+算法。(1)模型可以是函数f(xi),还可以是概率分布P(y|x)(2)策略可以是平方和最小,常见的损失函数还有0-1损失函数,对数损失函数等(3)算法可以是求导,EM算法等。注:EM算法也称期望最大化(Expectatio...原创 2019-07-31 19:13:02 · 138 阅读 · 0 评论 -
3.机器学习--知识点三:多项式与正则化
知识点三:多项式与正则化使用多项式拟合的时候,如果多项式最高次项比较大,模型就容易出现过拟合。正则化是一种常见的防止过拟合的方法,一般原理是在代价函数后面加上一个对参数的约束项,这个约束项被叫做正则化项(regularizer)。在线性回归模型中,通常有两种不同的正则化项:(1)加上所有参数(不包括θ0)的绝对值之和,即l1范数,此时叫做Lasso回归加粗样式;(2)加上所有参数(不包括θ0...原创 2019-07-29 08:14:49 · 447 阅读 · 0 评论