![](https://img-blog.csdnimg.cn/20190918140053667.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
AI
文章平均质量分 89
AI基础算法
peidezhi
这个作者很懒,什么都没留下…
展开
-
机器学习-特征缩放
从数值来看, 年份和工资相比数值太小, 对整个模型的影响基本上可以忽略。(方差计算的是数据平方, 个体数据相差值会放大,所以开方求平方根可以缩小换算回来。机器学习中, 特征值通常相差比较巨大, 不同维度的特征值相差巨大,导致部分特征影响微乎其微, 用来做训练效果不好。Xnew = x - mean(x) / std(x) [均值 标准差】举个例子, 工作年数和 工资收入作为特征值,来构建预测模型。因此,我们需要对特征值进行缩放, 已规避数值差异带来的影响。原创 2023-03-29 17:03:49 · 1083 阅读 · 0 评论 -
KNN算法
输入没有标签的新数据后,将新的数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数。k-近邻算法也可以像我们人一样做到这一点,不同的地方在于,我们的经验更”牛逼”,而k-邻近算法是靠已有的数据。如果K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果K=5,由于蓝色四方形比例为3/5,因此绿色圆被赋予蓝色四方形类。原创 2023-03-28 11:13:30 · 157 阅读 · 0 评论 -
tensorflow on spark安装
基于centos7.5,安装OS时安装包比较齐全。1 Python安装。需要Python 3.5+1.1wget --no-check-certificate https://www.python.org/ftp/python/3.6.5/Python-3.6.5.tgz1.2 解压编译安装到:/usr/local/python3 ./configure --pr...原创 2019-12-05 13:41:43 · 611 阅读 · 0 评论