- 博客(14)
- 收藏
- 关注
原创 [2020秋招面试]网易文本挖掘_9.19
自我介绍项目里的算法 (我忘了)在项目中碰到过与文本挖掘相关的算法以及框架是什么编程题;s1 = ‘abcd’ s2= ‘acd’s1 --> s2的最小操作次数(操作包括插入,删除,替换)
2020-09-19 10:46:08 356
原创 [Datawhale学习小组]_金融风控_Task2数据分析
Task2-数据分析EDA数据总体了解缺失值和唯一值深入数据-查看数据类型数据间相关关系用pandas_profiling 生成数据报告EDA数据总体了解读取数据集并了解数据集大小,原始特征维度读取数据的扩展知识 :对于文件特别大的场景,通过nrows参数,来设置读取文件的前多少行;分块读取通过info熟悉数据类型粗略查看数据集中各特征基本统计量缺失值和唯一值查看数据缺失值查看唯一值特征情况深入数据-查看数据类型类别型数据数值型数据离散数值型数据连续数值型数据
2020-09-18 22:18:45 255
原创 [Datawhale学习小组]_金融风控_Task1赛题理解
Task1-赛题理解学习目标赛题概况数据概况预测指标导入数据学习目标先给自己定一个学习目标:再锻炼锻炼分类建模的数据挖掘/代码/调参/可视化报告很有正式的打过比赛,想尝试一下,积累经验培养手感赛题概况数据概况数据量 超过120w,包含47个特征,其中15个事匿名变量。80w作为训练集,20w作为测试集A,20w作为测试集B。一些信息进行了脱敏(没有变量名)预测指标采用AUC 作为评价指标ROC曲线:True Positive Rate(TPR) v.s. False Posi
2020-09-15 22:31:17 383
原创 [2021秋招笔试记录]巨人网络_9.14_数据开发
编程题一数据流的中位数,先排序,然后取中间的数如果是奇数,(1+n)/2如果是偶数,n/2 (和普通的中位数定义不一样)输入:0.015.0055.00输出:0.010.015.00n = int(input())res = []for i in range(n): dat = float(input()) res.append(dat) res.sort() if len(res) % 2 == 0: print(res[int(
2020-09-14 21:32:27 728
原创 [2021秋招笔试记录]网易_9.12_文本挖掘师
编程题2字符串的回文子串个数(长度大于1)eg:输入:a输出:0输入:abbcbb输出:4(bb, bbcbb, bcb, bb)编程题3求字符串中包含‘a’,‘b’,‘c’,‘x’,‘y’,'z’中的字符且是偶数个的最长子串长度。0也算偶数输入:amabc输出:3(ama)编程题4男女匹配。男生也选出自己心仪的女嘉宾,女生再选心仪的男嘉宾。目标是最大化约会的对数。输入:0,1,2(男生的id)3,4,5(女生的id)6 (6个初步匹配信息)0,40,31,31,4
2020-09-13 06:37:53 420
原创 [2021秋招笔试记录]远景智能_9.10_算法工程师
编程题一n阶乘的结果的末尾有几个零eg:3!=6 output:05!= 120 output:1def NumberOfZero(n): if n == 1: res = 1 res = 1 for i in range(1,n+1): res *= i s = str(res) count = 0 for num in s[::-1]: if num == '0': coun
2020-09-10 13:20:14 275
原创 [2021秋招笔试记录]哔哩哔哩_9.4_算法
编程题题目一求最长回文字串题目二数组的最大连续和题目三大鱼吃小鱼:一次操作中,体积大的鱼会吃掉后面第一个比它小的鱼,如[6,5,4]一次操作后只剩6,6吃5,5吃4问几次操作后,鱼的数量才不变?输入:3(N)1,2,3输出:0输入:64,3,2,3,2,1输出:2[4,3,2,3,2,1] --> [4,3] -->[4]AC的代码def fishGame(sizes): if sorted(sizes) == sizes: r
2020-09-04 21:34:52 450
原创 [2021秋招笔试记录]百度_9.3_机器学习/数据挖掘/自然语言
编程题买纪念品:先选心动值大的,相同心动值,选价格低的;规定一定金额和重量输入:n,m,k: 有几件纪念品,最大重量,总金额上限然后输入n个纪念品的价格,重量,心动值输出:能买几件例子:3,10,1000100,5,350,3,2300,3,3输出 : 2棋子游戏只能走上、下、左、右,走一格,(可重复走某一格)每走一步的得分value= |X-Y| X上一个格子代表的值;Y下一个格子代表的值;求最小的value输入:3(N)1 2 41 3 11 2 1输出:2
2020-09-03 21:51:25 1023 1
原创 [2021年秋招笔试记录]OPPO_8.29_机器学习算法A卷
题型选择题(机器学习)填空题(卷积核计算;输入层(8个神经元)到隐藏层(5个)权重向量的shape;隐藏层到输出层(1个)的权重向量shape;两个向量的皮尔逊相关系数;两个向量的L1距离和L2距离)简答题KNN和K-means的三个区别;K的含义有什么不同MSE和logloss表达式;适用场景泛化能力指的是什么;FM表达式;FM为什么比LR泛化能力好编程题1 - 不调试;手写输入 [[‘aa’,‘bb’,‘cc’], [‘AA’,‘BB’], [‘11’,‘22’]]输出:[[
2020-08-30 07:10:45 1322
原创 [2021年秋招笔试记录]_阿里_8.28
题目一输入 A和B 两个长度为n 的 01 串,问 A至少通过几步操作才能变成B。字符串操作有:交换两个位置的数将1换为0;或者 0换成1翻转字符串例如:输入:7(字符串的长度)11110000010011输出3题目二给n和m,将n的数位进行排列,如520,可以组合成520,502,250,205,052,025;问其中有多少个不含前导0且整除m的数字例:输入:322 2输出:2 ------322 和232输入:97284 4输出:36(记不清了)...
2020-08-28 21:00:25 610
原创 [2021年秋招笔试记录] 华为_8.26
题目三两个猜单词。甲有一个长度为p的单词,乙去猜,每次加会告诉乙有m个字母存在且位置正确有n个字母存在但是位置不正确输入:P:单词的长度N:乙猜了几次后面每一行都是 单词 m n;以空格分割输出:正确的单词例:55cloxy 3 0cxmnu 1 1kcotd 2 1apqud 2 0bldwz 1 1输出:cloud题目二给出每个小柱形的宽和高;x[] = [1,1,1,1,2,1,1] y[] =[5,2,5,4,5,1,6] ;求能组成的矩形的最大面
2020-08-26 22:11:10 1111
原创 [笔记整理] Task4:建模调参
Task4: 建模调参内容介绍相关原理推荐代码示例Load data线性回归Cross-Validation时间序列绘制学习率曲线与验证曲线Lasso and RidgeNon-linear Regression贪心调参Grid Search 调参贝叶斯调参学机器学习的时候用的都是 R-studio, 正好借这次机会学一下怎么用 Python 来实现模型。所以,本文侧重代码整理内容介绍线...
2020-04-01 15:28:19 495
原创 [笔记整理] Task3-特征工程
特征工程定义常见的特征工程异常处理箱线图(或3-Sigma)分析特征归一化/标准化数据分桶缺失值处理特征构造特征筛选降维定义特征工程 (Feature engineering):(From Wikipedia) the process of using domain knowledge to extract features from raw data via data mining te...
2020-03-28 09:12:54 554
原创 [笔记整理] Task2 - 数据分析 EDA
Task2 - 数据分析 EDA定义步骤1. 载入各种数学科学以及可视化库2. 载入数据step1: 载入训练集和测试集step2: 简略观察数据3. 数据总览step1: 数据的相关统计量step2: 熟悉数据类型4. 判断数据缺失和异常step1: 每列存在 NAN 的情况 ---可视化step2: 查看异常值检测5. 了解预测值的分布6. 特征 features7. 数字特征分布8. 类型特...
2020-03-24 09:34:08 365
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人