![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
面试
colorful_-_
在读博士,前互联网大厂工程师,人工智能研究院技术产品经理,深耕人工智能、大模型等领域的研究与落地应用
展开
-
KNN(k近邻算法)最最最全面总结
KNN做回归和分类的主要区别在于最后做预测时候的决策方式不同。KNN做分类预测时,一般是选择多数表决法,即训练集里和预测的样本特征最近的K个样本,预测为里面有最多类别数的类别。而KNN做回归时,一般是选择平均法,即最近的K个样本的样本输出的平均值作为回归预测值。一 KNN算法概述KNN(K-Nearest Neighbor)工作原理:存在一个样本数据集合,也称为训练样本集,并且样本集中每个数...原创 2019-03-27 20:21:22 · 10558 阅读 · 2 评论 -
为什么特征数据要做对数变换?
平时在一些数据处理中,经常会把原始数据取对数后进一步处理。之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系,取对数作用主要有:缩小数据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非常大的数字。取对数后,可以...原创 2019-05-10 12:42:30 · 9792 阅读 · 0 评论 -
机器学习面试题(不断更新)
1.请简要介绍下tensorflow的计算图,深度学习 DL框架 中Tensorflow是一个通过计算图的形式来表述计算的编程系统,计算图也叫数据流图,可以把计算图看做是一种有向图,Tensorflow中的每一个节点都是计算图上的一个Tensor, 也就是张量,而节点之间的边描述了计算之间的依赖关系(定义时)和数学操作(运算时)。Tensorflow计算的过程就是利用的Tensor来建立一个计算...原创 2019-03-09 17:50:03 · 1091 阅读 · 0 评论 -
python面试题
1.python中的可变类型和不可变类型python中的可变数据类型:列表list和字典dict和集合set;不可变数据类型:整型int、浮点型float、字符串型string和元组tuple。用一句话来概括上述过程就是:“python中的不可变数据类型,不允许变量的值原地发生变化,如果改变了变量的值,相当于是新建了一个对象,而对于相同的值的对象,在内存中则只有一个对象,内部会有一个引用计数来...原创 2019-03-09 17:58:13 · 276 阅读 · 0 评论 -
python中连接字符串用join还是+
join的性能明显好于+。这是为什么呢?原因是这样的,Python字符串是不可变对象,当用操作符+连接字符串的时候,每执行一次+都会申请一块新的内存,然后复制上一个+操作的结果和本次操作的右操作符到这块内存空间,因此用+连接字符串的时候会涉及好几次内存申请和复制。而join在连接字符串的时候,会先计算需要多大的内存存放结果,然后一次性申请所需内存并将字符串复制过去,这是为什么join的性能优于+...原创 2019-04-15 21:50:51 · 364 阅读 · 0 评论 -
python面试常考的题目:python中的可变类型和不可变类型
python面试常考的题目:python中的可变类型和不可变类型python中的可变数据类型:列表list和字典dict和集合set;不可变数据类型:整型int、浮点型float、字符串型string和元组tuple。用一句话来概括上述过程就是:“python中的不可变数据类型,不允许变量的值原地发生变化,如果改变了变量的值,相当于是新建了一个对象,而对于相同的值的对象,在内存中则只有一个对象...原创 2019-04-15 21:56:23 · 319 阅读 · 0 评论