![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
每日一题
文章平均质量分 70
Avasla
好好学习,天天向上。
展开
-
【数据分析面试】67.计算每日加权平均新用户数(SQL)
社交媒体平台的分析团队希望分析每日用户增长的短期趋势。为此,他们希望计算新日用户的 3 日滚动加权平均值,其中当天的权重为 3,前一天的权重为 2,前两天的权重为 1。表中计算新日用户的 3 日滚动加权平均值,并将平均值保留到小数点后两位。有缺失日期的情况下,如何计算 3 日滚动加权平均值?更多详细答案可关注公众号查阅。编写一个 SQL 查询,从。平台将新用户的记录记录到。原创 2024-06-13 16:45:00 · 233 阅读 · 0 评论 -
【数据分析面试】65.找出第一个大于10的数字(python循环结构)
给定一个数字列表,编写代码找出列表中第一个大于 10 的数字,并打印该数字。如果列表中没有大于 10 的数字,则打印一条消息说明这一点。原创 2024-06-10 11:30:00 · 226 阅读 · 1 评论 -
【数据分析面试】64. 生成杨辉三角(Python)
编写一个Python程序,要求用户输入一个正整数n,并输出一个大小为n的杨辉三角(Pascal’s Triangle)。杨辉三角的性质:每行的第一个和最后一个元素都是1。(k > 0 且 k < n)请输入一个正整数:5。原创 2024-06-09 12:00:00 · 205 阅读 · 0 评论 -
【数据分析面试】63.计算订单总金额-升级版(SQL复杂计算优化)
假设你在经营一个电子商务平台,需要计算订单的总金额。`orders`表包含了订单的相关信息。编写一个查询,以获取每个订单的总金额,考虑不同商品的单价、数量和应用的优惠券折扣,以及所有订单的平均总金额(以美元为单位)。优惠券分为两种类型:商品折扣优惠券,以及订单总金额满50减10的优惠券。优惠券可以同时适用于多个商品。原创 2024-06-08 14:15:00 · 290 阅读 · 0 评论 -
【数据分析面试】62.计算订单总金额(SQL数字计算的常见问题)
假设你在经营一个电子商务平台,需要计算订单的总金额。`orders`表包含了订单的相关信息。编写一个查询,以获取每个订单的总金额,考虑商品单价、数量和应用的优惠券折扣,以及所有订单的平均总金额(以美元为单位)。原创 2024-06-07 10:00:00 · 475 阅读 · 0 评论 -
【数据分析面试】61. XGBOOST VS随机森林 (机器学习算法)
XGBOOST VS随机森林 有什么区别,举例说明它们适合的使用场景原创 2024-06-06 14:45:00 · 419 阅读 · 0 评论 -
【数据分析面试】60.计算滑动窗口平均值 (Python & SQL)
给定一个数字列表 `nums` 和一个整数 `window_size`,编写一个函数 `moving_window` 来计算滑动窗口平均值。原创 2024-06-05 14:00:00 · 649 阅读 · 0 评论 -
【数据分析面试】58.计算均方根误差 (Python)
通过这种方法,我们可以计算并返回两个列表之间的均方根误差,从而评估预测模型的性能。均方根误差(RMSE)是衡量预测值与实际值之间差异的标准。来计算回归模型的均方根误差。该函数应接收两个列表,一个代表预测值。更多详细答案可关注公众号查阅。原创 2024-06-03 17:23:56 · 523 阅读 · 0 评论 -
【数据分析面试】59.找出共同关注者最多的两个用户(SQL:自连接)
写出一个查询语句,找到具有最多共同关注者的两个用户,并找出他们两人的user_id。结果返回表,每一行应该包含user1_id和 user2_id,其中。表,储存着用户id和他对应的关注者id。原创 2024-06-04 12:00:00 · 278 阅读 · 0 评论 -
【数据分析面试】57.选择特定数据类型(Python:select_dtypes)
针对给定的Df,根据要求筛选特性类型的数据。原创 2024-05-30 18:00:00 · 280 阅读 · 0 评论 -
【数据分析面试】56.数据格式转换(Python:melt函数)
给定一个df,包含ABCDE多个列。请编写一个 Python 程序,将列 'D' 和 'E' 转换为长格式,并使用 'A'、'B' 和 'C' 作为标识符。原创 2024-05-29 17:12:25 · 363 阅读 · 0 评论 -
【数据分析面试】55. 寻找双词组 (Python)
编写一个名为 `find_bigrams` 的函数,该函数接收一个句子或段落的字符串,并按顺序返回其所有双词组的列表。原创 2024-05-28 17:03:36 · 231 阅读 · 0 评论 -
【数据分析面试】54.员工信息(HR)数据库搭建
由于发展需求,进一步提高公司人员统筹管理的能力,公司决定要重新升级人力数据管理系统。现在,你的任务是为公司重新。原创 2024-05-27 17:27:29 · 981 阅读 · 0 评论 -
【数据分析面试】53.推送消息的分布情况(SQL)
我们有两个表,一个是 `notification_deliveries` 表,另一个是包含 `created` 和购买 `conversion dates` 的 `users` 表。如果用户没有购买,那么 `conversion_date` 列为 `NULL`。编写一个查询,以获取用户转换前的推送通知总数的分布情况。原创 2024-05-25 19:00:00 · 471 阅读 · 0 评论 -
【每日一题】52.20个机器学习问题 2 (模型部署、实践流程和应用问题)
略原创 2024-05-24 19:06:23 · 978 阅读 · 0 评论 -
50道题目!Python、SQL数据库、AB测试、业务分析、机器学习都在这里了!
每日一题系列已经更新了50道题目啦!题目难度为初级到中级,涵盖了Python、SQL数据库、AB测试、业务分析、机器学习五大主题,适合初学者和有一定基础的朋友。原创 2024-05-24 11:53:27 · 794 阅读 · 0 评论 -
【数据分析面试】51. 读取大型csv文件
假设你是一家科技公司的数据分析师。近期由于管理层变动,新的总经理上任,他想要了解公司过往的交易情况数据,并且这个任务由数据分析团队负责完成。历史交易数据下载导出完成后,团队发现Csv文件大小超过了5个G,使用pandas读取时间过长。你有什么好的解决办法吗?原创 2024-05-23 16:53:36 · 271 阅读 · 0 评论 -
【数据分析面试】50.20个AB测试面试题
20个AB测试面试题原创 2024-05-21 17:16:24 · 126 阅读 · 0 评论 -
【数据分析面试】49. 计算分公司的总销售额(Python:groupby & merge用法)
你在一家跨国零售公司工作,全球各分公司的销售数据都存储在不同的表格中。当前的数据结构在业务分析中表现低效,管理层需要你提供专业知识来简化数据。编写一个Python程序,创建一个数据表,显示每个分支机构每年的总销售额。原创 2024-05-20 17:51:22 · 1002 阅读 · 0 评论 -
【数据分析面试】48.如何在SQL中高效地创建和管理数据库表(20个SQL操作问题)
这里的20个问题主要考察如何在SQL中高效地创建和管理数据库表,包括数据库表创建、修改、删除和查询等SQL操作。原创 2024-05-19 18:07:12 · 900 阅读 · 0 评论 -
【数据分析面试】47.根据权重随机选择键 (Python)
给定一个带有权重的字典,请编写一个函数 `random_key`,该函数根据权重以比例概率随机返回一个键。原创 2024-05-18 17:12:33 · 171 阅读 · 0 评论 -
【数据分析面试】46. 华尔街情感分析挑战 (ML问答)
华尔街的投资公司聘请你作为机器学习工程师。你的任务是在 Reddit(类似百度贴吧的论坛网站) WallStreetBets 的数据集上开发情感分析模型。在你开发和运行模型之后可能出现的潜在问题有哪些呢?原创 2024-05-17 19:00:00 · 395 阅读 · 0 评论 -
【数据分析面试】45.亚马逊SQL订单数据问题
在最近的一次Amazon数据分析师面试中,要求候选人编写SQL查询获取一下数据。更多详细答案可关注公众号查阅。原创 2024-05-16 17:03:13 · 445 阅读 · 0 评论 -
【数据分析面试】44.分析零售客户群体(Python 集合Set的用法)
集合(Set)用于存储多个不重复的元素。集合是无序的,并且元素不能重复。集合支持各种数学集合操作,如并集、交集和差集。考虑使用python中关于集合的操作。注意题目要求生成一个字典,想想字典和集合有什么不同。假设你是一家在线零售商的数据库管理员,需要分析两类客户的数据。包含在最近一次促销活动中购买了商品的客户ID,另一个集合。对称差集是所有属于一个集合但不属于另一个集合的元素。包含订阅了新闻通讯的客户ID。原创 2024-05-15 18:00:00 · 332 阅读 · 0 评论 -
【数据分析面试】43.寻找给小费最多的客人(Python:字典用法)
给定两个非空列表`user_ids`和`tips`,编写一个名为`most_tips`的函数,用于找到给小费最多的客户。原创 2024-05-14 18:00:00 · 517 阅读 · 0 评论 -
【数据分析面试】42.用户流失预测模型搭建(资料数据分享)
保持高的客户留存率可以稳定和提到企业的收入。因此,预测和防止客户流失是在业务中常见的一项数据分析任务。这次分享的数据集包括了电信行业、银行、人力资源和电商行业,涵盖了不同业务背景下的流失预测数据。原创 2024-05-13 17:09:58 · 369 阅读 · 1 评论 -
【数据分析面试】41.如何分析处理Netflix流失用户?(业务分析)
假设有一百万 Netflix 用户在过去六个月内没有登录到 Netflix。你会如何确定原因?以及你会如何处理这些用户?原创 2024-05-12 17:50:11 · 1194 阅读 · 0 评论 -
【数据分析面试】40.20个数据开发治理基础问题
在当今数字化时代,数据已成为企业最重要的资产之一。如何管理数据、确保数据的安全性和质量,以及如何有效地利用数据来推动业务发展,这些都是我们面临的挑战。原创 2024-05-10 18:05:39 · 1352 阅读 · 0 评论 -
【数据分析面试】39.银行交易滚动平均值 (SQL:滑动窗口ROWS)
我们有一个银行交易表,包含三列,`user_id`、存款或取款值(根据值是正数还是负数确定),以及每笔交易的 `created_at` 时间。计算存款的三天滚动平均值,并按日输出。原创 2024-05-09 18:00:00 · 403 阅读 · 0 评论 -
【数据分析面试】38.更新图书馆数据(Python)
作为一名精通Python的图书管理员,你正在搭建一个更高效地更新图书数据的系统。编写一个函数,用于更新数据表中特定 `book_id` 的 `availability` 值,并返回更新后的数据表。原创 2024-05-08 18:00:00 · 154 阅读 · 0 评论 -
【数据分析面试】37.找出连续出现3次的数字(SQL:LEAD()和 LAG()的使用)
给定一个日志表 `Logs`,包含两列:`Id` 和 `Num`。请编写一个 SQL 查询,找出在 `Num` 列中连续出现至少三次的数字。原创 2024-05-07 18:00:00 · 646 阅读 · 0 评论 -
【数据分析面试】36.SAAS公司邮件营销策略分析(业务分析)
假设你在一个B2B SAAS公司营销团队工作。本季度即将结束,但当前收入距离预期目标还差10%。营销团队的一个高管要求负责电子邮件营销的人向所有客户群发邮件,要求他们购买更多产品。这是个好主意吗?为什么?原创 2024-05-06 19:00:00 · 721 阅读 · 0 评论 -
【数据分析面试】35.20个机器学习问答题
交叉验证是一种评估模型性能的统计技术,交叉验证通过将数据集划分为多个子集,轮流使用其中一个子集作为测试集,其余子集作为训练集来评估模型的性能,以获取更可靠的模型性能估计。在机器学习中,交叉验证可以帮助评估模型的泛化能力,减少因数据划分不当而引入的偏差。原创 2024-04-30 17:01:12 · 1082 阅读 · 0 评论 -
【数据分析面试】34.填充NaN值 (Python:groupby/sort_value/ffill)
根据要求处理NAN值原创 2024-04-29 17:31:01 · 1049 阅读 · 0 评论 -
【数据分析面试】33.计算加权平均值 (Python: enumerate())
如何在Python中计算加权平均值?原创 2024-04-28 18:00:00 · 755 阅读 · 0 评论 -
【数据分析面试】32.矩阵元素求和 (Python: for…in…语句)
这个问题的关键在于遍历矩阵中的所有元素,并对它们求和。我们可以通过嵌套循环遍历矩阵的行和列,并累加每个元素的值来解决这个问题。关键字用于指定要迭代的可迭代对象。循环体内的代码将被执行,针对可迭代对象中的每个元素都会执行一次。你的任务是编写一个函数,返回矩阵中所有元素的和。是Python中的一种迭代结构,用于遍历可迭代对象中的元素。该函数应能处理正整数和负整数,并将求和结果作为一个整数返回。结构的语法使得在处理循环迭代时非常简洁和易读。是循环中的变量,它依次存储了列表。中的每个元素,然后将其打印出来。原创 2024-04-27 17:41:04 · 414 阅读 · 0 评论 -
【数据分析面试】31. 产品销售额排名(SQL窗口函数)
写一条SQL查询,求每个销售日期内的产品销售额的排名,结果按照销售日期顺序排列。原创 2024-04-26 18:36:09 · 381 阅读 · 0 评论 -
【数据分析面试】30. 用户订阅预测模型 (机器学习:Boosting 算法)
假设你在一家媒体公司工作。你正在对用户活动数据集进行 Boosting 算法的训练,以预测用户是否会转换为付费订阅。在训练模型时,一位同事建议将模型分为两个,一个针对老用户,另一个针对新用户。这是否是一个好方法?为什么?原创 2024-04-25 17:07:19 · 508 阅读 · 0 评论 -
【数据分析面试】29.查找职工信息 (SQL文字处理/通配符查找)
现在公司里有职工信息表`Worker`, HR需要你提供不同的职工信息。原创 2024-04-24 18:00:00 · 1128 阅读 · 0 评论 -
【数据分析面试】28. 20个Python问答题 (入门级考察:基础操作、数据处理与分析统计)
20个问题考察了 Python 的基础能力,包括数据结构、基本操作、数据处理、数据分析和统计等方面。无论是从事数据分析、机器学习还是其他数据相关工作,这些都是都是必不可少的基础技能。原创 2024-04-23 18:00:00 · 811 阅读 · 0 评论