![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
题目挖掘
文章平均质量分 79
亚当-麦当当
大数据攻城狮,立志为同志们尽可能多的提供干货!
展开
-
华为面试题及答案——机器学习(二)
偏差是指模型预测值与真实值之间的系统性误差。偏差反映了模型在训练数据上的拟合能力,即模型对数据中模式的捕捉能力。高偏差通常意味着模型过于简单,不能很好地捕捉数据的复杂关系。低偏差:模型能够较好地拟合训练数据,捕捉数据中的模式。高偏差:模型对数据中的模式捕捉不足,通常表现为欠拟合。原创 2024-06-25 20:05:01 · 1119 阅读 · 1 评论 -
华为面试题及答案——机器学习(一)
内生变量问题是指在回归分析中,自变量与误差项相关联,这会导致回归系数的估计偏误和不一致。内生性问题的存在会破坏普通最小二乘法(OLS)估计量的无偏性和一致性,导致模型结果不可靠。特性参数模型非参数模型参数数量固定随数据量增加而增加假设明确的分布或关系假设无需明确假设计算效率高相对较低灵活性较低较高适用场景小数据集,模型形式明确的情况大数据集,数据结构复杂的情况可解释性强弱。原创 2024-06-23 09:51:01 · 1504 阅读 · 0 评论 -
华为面试题及答案——大数据
在 hadoop-env.sh 文件中,可以增加 JVM 分配给 NameNode 的内存。通常是在 HADOOP_NAMENODE_OPTS 中增加 -Xmx 参数来增加最大堆内存。export HADOOP_NAMENODE_OPTS="-Xmx8g -Xms4g ${HADOOP_NAMENODE_OPTS}"将上面的 8g 和 4g 替换为适合你系统的值。启用高可用配置,可以将元数据分布到多个 NameNode 上,从而减少单个 NameNode 的内存压力。以下参数可以优化 NameNode 的内原创 2024-06-22 21:18:55 · 1509 阅读 · 0 评论 -
好帅的解题思路!!几行代码解决
编写解决方案找出"2013-10-01"至"2013-10-03"期间非禁止用户(乘客和司机都必须未被禁止)的取消率。非禁止用户即 banned 为 No 的用户,禁止用户即 banned 为 Yes 的用户。其中取消率Cancellation Rate需要四舍五入保留两位小数。原创 2024-04-24 08:17:42 · 444 阅读 · 0 评论 -
大数据真题讲解系列——拼多多数据分析面试题
两支篮球队进行了激烈的比赛,比分交替上升。比赛结束后,你有一个两队分数的明细表(名称为“分数表”)。表中记录了球队、球员号码、球员姓名、得分分数及得分时间。对于第一种方法适合小间距取值,当取值过大时候如100甚至1000行连续值时,这个方法显然不可以使用了,那么此时我们便可以使用等差数列发轻松解决问题。每行数据向上移动一行并作为新的一行rn1,同理向上移动两行作为新的一行rn2,当移动参数值 = rn1 = rn2时,所取的参数值便为所求。请你写一个SQL语句,统计出连续3次为球队得分的球员名单。原创 2024-04-20 09:04:31 · 1532 阅读 · 1 评论 -
拼多多面试题——力扣版测试用例纠错
最近我看到力扣上这个题目,用了三种方法,结果没有一种正确,我就纳闷儿了,为何总有一个测试用例过不了,结果我发现这个测试用例确实有问题啊。原创 2024-04-23 13:43:39 · 432 阅读 · 0 评论