面试
文章平均质量分 73
rubyw
Data Analyst
让我们一起愉快地搞数据分析吧!
展开
-
数据分析师笔试试卷五:SQL、Python——(YH)
现有用户购买行为表记录了客户ID、购买的产品ID和每次购买的金额,如下表,请统计每个产品购买金额前3的用户,输出产品ID、客户ID和购买金额。1.3-请用SQL语句查询每一天申请的订单数量,通过的数量,通过率,放款总金额,放款件均(base_apl 左关联 base_loan)接下来,可以先尝试 1.5 的平方,即 1.5×1.5 = 2.25,因为 2.25 小于 3,所以 大于 1.5。两个对象完全独立,互不影响。首先,我们知道 1 的平方是 1,2 的平方是 4,所以 的值在 1 到 2 之间。原创 2024-08-05 02:06:05 · 968 阅读 · 0 评论 -
数据分析师笔试试卷四:SQL——视频(KS)
假设总共有 N 条视频数据,总共有 M 个不同的审核员 ID,每个审核员 ID 在总量中的数量为 n_i,则抽取数量为 floor(1000 * n_i/N),其中 floor函数表示向下取整。x2~y1之间重复计算的时间就是多开)求每个审核员剔除多开后的时间(注:审核时间=提交时间-领取时间) (25分,考点:逻辑***)4、现在要从总量中抽出1000条提交事件的视频数据,要求每个审核员id的抽取比例要相近 (注:抽取比例=抽取量/总量) (20分,考点:逻辑*)原创 2024-08-05 01:46:38 · 476 阅读 · 0 评论 -
SQL优化的方法有哪些?
有两个表, customers ( customer_id , name )和 orders ( order_id , customer_id , amount )。优化后:可以先对 orders 表按照 customer_id 进行分组求和,得到一个临时表,然后再与 customers 表进行连接,提高效率。假设有一个用户表 users ,包含 id(用户 ID ,主键)、name(用户名)、age(年龄)和 city(所在城市)等列。,这样会返回该客户的所有订单然后再排序,数据量可能很大。原创 2024-07-22 18:36:40 · 703 阅读 · 0 评论 -
Hive SQL处理时间格式都有哪些
不同的数据库在时间处理函数和格式上可能会有细微的差异,但上述方法在 Hive SQL 中是较为常用的。原创 2024-07-16 00:32:44 · 454 阅读 · 0 评论 -
SQL常用的函数有什么
这些只是 SQL 中常用函数的一部分,具体的使用取决于您的数据库管理系统(如 MySQL、Oracle、SQL Server 等)以及具体的业务需求。原创 2024-07-16 00:24:31 · 368 阅读 · 0 评论 -
常用的linux命令是是什么
这只是一小部分常用的 Linux 命令,还有许多其他命令可用于各种不同的任务。:实时显示系统中资源使用情况和进程信息。:在文件中搜索指定模式的文本。:列出目录中的文件和子目录。:查看文件内容并在终端显示。:移动或重命名文件和目录。:更改文件或目录的权限。:在指定目录下查找文件。):查看网络接口配置。:分页查看文件内容。原创 2024-07-15 01:35:25 · 306 阅读 · 0 评论 -
数据分析师笔试试卷三:Excel、SQL、Python、算法
例如,有一组学生的数学成绩(连续变量)和性别(分类变量),要研究性别对数学成绩的影响,可以使用 t 检验;一组学生,其中一部分是男生,一部分是女生,同时有他们的数学考试成绩。在控制每天学习时间这个变量的影响下,计算数学成绩和语文成绩之间的偏相关系数,以更准确地了解它们之间的直接关系。:当二分变量是人为划分的(例如,考试成绩 60 分以上为及格,60 分以下为不及格),与连续变量之间的相关性可用二列相关系数。例如,在研究教育程度与收入的关系时,控制工作年限这个变量的影响,计算出的就是偏相关系数。原创 2024-07-15 01:28:40 · 1044 阅读 · 0 评论 -
EXCEL、SQL、Python去重的方式分别是什么?
DISTINCTcolumn1column1column2GROUP BYMIN()MAX()column1column2EXISTScolumn1column2这些方法可以根据具体情况选择合适的去重策略,在处理复杂的数据去重需求时特别有用。如果有特定的数据处理场景或者更多的问题,请随时告诉我!setpandaspandas在 Python 中,通常使用不同的方法来处理列表或者数组中的唯一值。这取决于你使用的数据结构和需要的功能。原创 2024-07-10 01:11:03 · 937 阅读 · 0 评论 -
数据分析师笔试试卷二:SQL、Python、线性回归算法预测
提交时请在文件名称前加上你的名字。原创 2024-07-10 00:24:18 · 779 阅读 · 0 评论 -
数据分析师笔试试卷一:Excel、SQL、Python、数据分析思维
SUMIFS主要用于根据多个条件进行求和,适合处理具有多个筛选条件的数据。SUMPRODUCT主要用于对数组或范围中对应元素进行乘法后求和,适合进行复杂的数组运算和统计计算,如加权求和、多条件计算等。举例说明假设你有一个员工信息表,包括员工姓名和对应的工资。你需要根据员工姓名查找他们的工资。可以使用 VLOOKUP 函数来实现,或者使用 INDEX-MATCH 组合来进行更灵活的查找。=VLOOKUP("张三", A2:B100, 2, FALSE)原创 2024-07-09 23:34:12 · 2215 阅读 · 0 评论