2021软件工程保研经历

个人情况

  • 学校:末流211(UPC)
  • 专业:软件工程
  • 前五学期成绩排名:2/129
  • 四级:596 六级:494
  • 竞赛:美赛M奖、省级奖4项、校奖若干
  • 科研:参加一项大创、软著一项

众多大佬中平平无奇的保研菜鸡

夏令营参加情况

  1. 四川大学网络空间安全学院:入营,无offer
  2. 山东大学软件学院:优营
  3. 中南大学计算机学院:优营
  4. 四川大学计算机学院(软件学院):优营
  5. 同济大学软件学院:未入营
  6. 华东师范大学数据学院:未入营
  7. 华东师范大学软件学院:未入营
  8. 东南大学网络空间安全学院:未开奖

参营的那段时间

自己开始准备夏令营的时间比较晚,6月初各大高校陆续发布夏令营通知才开始准备文书材料、简历等。
6月中下旬我参加了西电校园宣讲活动,这是我第一次推免面试,感谢这次经历彻底唤醒了还在迷茫中的自己!面试中老师主要还是围绕我的简历进行提问,可我还是因为时间太长或有些知识掌握的不扎实而答的一塌糊涂,最后让用英文介绍青岛我也阿巴阿巴的糊过去了。从那之后,让我意识到对自我介绍、简历中的经历精确掌握是多么的重要,还有就是计算的的四大专业课。
经历了西电面试后,我也下意识地去准备面试和口语,无奈那时候考试周、项目答辩让我根本没有太多的精力去准备。在这里非常想吐槽我们专业的安排:7月2号最后一场考试结束、3号持续一个学期的软件项目答辩还要上交一堆文档(2号晚上小组直接没有睡觉)、4号开始为期两周的小学期的实习。然而川大网安的夏令营7号就开始了,直接不想让我有学上了。
7月初的自己真的是非常的累和不幸。首先是我的电脑突然坏了;因为实习组队的问题和一个关系比较好的朋友闹掰了,至今也没和好。一边有着实习任务一边准备面试真的让我非常焦虑。

四川大学网络空间安全学院

夏令营报名250+人,入营了120+人。分为笔试和面试两部分,笔试通过了才有机会面试。
笔试:
45分钟180个选择题,涉及信息安全、网络原理、操作系统、数据结构、数据库五个部分。题目比较基础,但我本科不是学安全的,有些信安的知识不是很了解。(虽然也临时突击了两天。。)没想到自己通过了笔试,当时剩下了不到60人。
面试:
川大面试都用welink平台,采用双机位,面试之前需要准备3分钟的自我介绍ppt。首先给了一段英文朗读并翻译,好像和数据的安全有关。接着是专业知识操作系统、数据结构、网络原理、数据库原理4选2回答。

1. 什么时候顺序存储结构比链式存储结构有效?
时间复杂度:
查找:顺序存储结构O(1),单链表O(n)
插入和删除:顺序存储结构需平均移动一半元素长度,为O(n);单链表在计算出某位置指针后,为O(1)
空间复杂度:
顺序存储结构需要预分配存储空间;单链表不需分配存储空间,元素个数不受限制。
综上,若线性表需要频繁查找,很少进行插入和删除,可采用顺序存储结构;需频繁进行插入和删除,采用链式存储结构。
2.电路交换、报文交换、分组交换的区别
电路交换:使用电路交换前需建立预先建立一条专用的通信线路,不存在连接建立时延,用户可随时发送报文。只允许通话的两个用户使用,而不允许其他人使用。
报文交换:把整个报文完整的发送到链路中,在某个节点存储下来之后再发送到下一个节点。
分组交换:分组交换采用转发存储技术,将一个完整的报文,分成若干个分组,再进行转发,而且每个分组之间经过哪一个节点,与上一个分组完全没有关系。

接下来网络安全基础知识是必须回答的:
1.非对称数字签名原理,数字签名的应用
数字签名原理:
使用信息发送者的私钥对信息进行加密,因为只有信息的发送者拥有私钥;任何人可以使用公钥对密文进行解密,若解密成功则说明该信息来自特定的发送者。
数字签名的应用:
网站认证:用来认证一个网站的身份
代码签名:如果Windows上的可执行程序程序来源于正规公司,那么通常它会有代码签名,用于确保其来源可靠且未被篡改。
比特币:比特币是一种完全匿名的数字货币,它的身份认证是基于ECDSA。比特币的账户地址就是对公钥计算摘要得到的,向全世界公布。而确认你是账户拥有者的唯一办法就是看你有没有账户对应的私钥。对于比特币中的任意一个交易记录,只有当其中付款方的签名是有效的,它才是有效的。如果账户私钥丢失,那么你将永远地失去里面的钱;

接着就是根据ppt上的项目经历进行提问了。作为夏令营的第一场面试,糊的非常严重。最后优营也只有20人,情理之中。

山东大学软件学院

入营了130+人,山大软院只有面试,提问前需不需要进行自我介绍看所在分组的老师情况,我所在的组开头需要口头中文自我介绍的。
1.数学建模国赛是如何建模的
首先从题目和数据中提取可能的特征,对若干特征进行降维后,建立逻辑回归模型.
2.使用什么方法进行降维
PCA 主成分分析根据特征值进行降维
3.建立的模型准确率是多少,是怎么得出来的
大概75%左右。因为题目中给了一些银行信贷决策,是一个有监督学习,于是我们将样本分为训练集和测试集,用训练集进行逻辑回归训练,测试集进行准确率的估算。
4.准确率有点低啊,有没有想到好的改进措施。
暂时没想到,我们后面对其进行了敏感性分析。
(这个地方答的不好,可以说,在特征选择方面,重新对可能的特征进行选择,剔除无关的特征;在数据方面,可以对数据进行预处理:剔除异常值和缺省值、数据标准化等)
5.为什么选择使用逻辑回归?
愣住了…当时借鉴的一篇参考文献
(对线性关系拟合效果较好;计算速度快;返回的分类结果不是固定的0或1,而是概率,因此可以给出信贷决策的信用分;抗噪能力强;数学目的是求解能够让模型对数据拟合程度最高的参数 ϑ \vartheta ϑ值,以此构建预测函数y(x),然后将特征矩阵输入预测函数计算逻辑回归结果)
6.换第二个老师专门考核英文,用英文问我自我介绍中提到了转专业,你原专业是什么,为什么转专业?
Industrial design;然后就说明自己不擅长画画,大一对编程感兴趣。(英语口语能力还是太差了…说了不到一分钟就不知道说啥了)
7.第三个老师,听你介绍说做过一个关于网络安全事件识别的大创项目,能说说能识别哪些事件以及如何建模的
可以对服务器web日志的入侵性及入侵行为进行判断。
首先对Flume中收集的日志的url打散成一个个字母;接着利用N-Gram进行分词,分成2字符的序列;使用TF-IDF文本特征提取算法,根据特征在日志出现的频率及出现该特征的日志的数量进行判断;最后对提取的特征建立逻辑回归模型(没错,又是LR。。)并根据准确率不断调整参数和迭代次数。
8.软件著作权做的什么
利用Spring框架建立前后端分离的web应用,利用ajax异步请求和百度地图API实现精准的考勤签到。
9.调用了百度地图API的哪些函数
当时忘了,直接说的不知道
(后来翻了翻源码,创建BMap类,利用centerAndZoom初始化地图;使用Geolocation进行定位,getCurrentPosition获取当前位置)
10.最后一个老师,如果你研究生阶段延毕了该怎么办
言之有理即可,就说在延毕期间更加努力学习、多实践、多总结。

山大软院需要面试结束后,需要联系意向导师,不联系则不发优营。最后结果出来是优营,不过排名挺低的,50多名。因为现在学院招生名额没确定,最后拟录取是按照排名进行的。

中南大学计算机学院

一直不知道入营和优营有多少人,通知都是以邮件的形式发送。不过学院的研招宣传群有1000+人。。中南计院也是只有面试,开始需要5分钟以内的ppt中文自我介绍。
1.美赛胡蜂传播模型是怎么建立的
根据题目给出的各年份胡蜂出现经纬度坐标数据,剔除无关数据后,首先对各年份坐标位置进行可视化,发现胡蜂传播呈现以某些点为中心扩散的趋势。于是建立了高斯混合(GMM)模型,即利用多个正太分布进行拟合。
2.高斯混合模型用到了什么算法
我当时知道是利用EM算法迭代求得,可忘了具体算法的原理。于是我回答了不清楚,调用sklearn做的。
(使用EM算法对模型参数进行估算,EM算法是一种迭代优化策略,每一次迭代都分期望步(E)和极大步(M).首先根据己经给出的观测数据,估计出模型参数的值;然后再依据上一步估计出的参数值估计缺失数据的值,再根据估计出的缺失数据加上之前己经观测到的数据重新再对参数值进行估计,然后反复迭代,直至最后收敛,迭代结束)
3.美赛M奖的获奖比例
7%左右
4.两次数学建模(国赛和美赛)如何对缺省值处理
美赛对于缺省值是直接剔除
国赛有的是直接剔除,有的利用随机森林进行填补
5.随机森林是怎么实现的
直接调库。。。
(随机森林是一个用在原始数据中做不同采样,建立多颗决策树,再进行求平均值等等来降低过拟合现象,提高结果的机器学习算法)
6.有没有想好以后的研究方向
具体的方向没有想好,但有个大致的方向。想研究大数据方面或机器学习有关的,因为最近刚接触了和大数据有关的hadoop集群和spark。
7.你对spark了解多少
简单了解一点,一些spark ml常见库以及scala程序编写。
8.软件著作权做的什么
就和山大软院面试一样回答(没有问用到百度API什么函数)
9.你四六级怎么相差100分,六级那么难吗
六级是大三考的,当时课也比较多,有点忽略了对英语的学习。
10.那你顺便用英文介绍一下自己
当时邮件通知让中文介绍,于是没准备英文的。。但我早上刚面试完山大的,紧接着准备了为何转专业的英文问题。于是在自我介绍的时候长篇大论在说为何转专业,不过说的还是比较流畅的(所以面试前最好中英文介绍都准备好)

最后的面试结果是以邮件的形式通知的。邮件上说优营采取先报先录和择优录取。虽然拿到了优营,但能不能录取还是悬念。

四川大学计算机学院(软件学院)

入营了大概150人,面试流程和网安学院差不多。面试前需要提交一份ppt版的个人陈述,也是面试老师提问的依据。宣读完诚信面试承诺书后,首先是给一段英文朗读并翻译,我抽到的是和软件需求(software requirements)有关的,有些单词不好翻译但还是能顺下来。接下来是网络原理、数据结构、操作系统3选2抽题回答:
1.二叉树后序遍历的过程
二叉树采用递归的方式,先遍历左子树,后遍历右子树,最后遍历根节点。
2.单工、半双工、全双工的区别
单工:只有一个方向的通信
半双工:双方都可以发送和接受信息,但不能在同一时间发送
全双工:通信双方可以同时发送和接受信息,但需要有两条独立的信道。
接着进行个人陈述上的提问:
1.大创如何进行建模的
同山大面试问题7一样
2.提取了哪些特征
使用TF-IDF算法进行特征提取。
Hashing TF操作接收词条的集合然后把这些集合转化成固定长度的特征向量(特征向量在某一维度上的值即该词汇在文档中出现的次数);
IDF操作是接收特征向量(由HashingTF产生),然后计算每一个词在文档中出现的频次,并对单纯的词频特征向量进行修正,使其更能体现不同词汇对文本的区别能力。

最后合格营员是在闭营仪式上宣布的,分为两个批次:可被第一志愿录取和需要调剂的。很荣幸自己能在第一批次,排了20多名。川大官网上说,考核合格,拿到推免名额就可以直接被录取,所以还是特别开心哒!有学上了。
在这里插入图片描述

对西电面试的补充

西电面试中有两个和大创有关的问题,值得整理一下:
1.逻辑回归的原理
与线性回归原理相似。LR是基于Sigmoid函数实现的,LR模型的主要任务是给定一些历史的{X,Y},其中X是样本n个特征值,Y的取值是{0,1}代表正例与负例,通过对这些历史样本的学习,从而得到一个数学模型,给定一个新的X,能够预测出Y。
可以参考:逻辑回归原理详细推导
逻辑回归原理详解

2.你提到利用逻辑回归对日志入侵性进行分类,能说说回归和分类的区别吗
逻辑回归是用与回归类似的思路解决了分类问题。
输出数据类型不同:分类输出的数据类型是离散数据,也就是分类的标签;回归输出的是连续数据类型,例如逻辑回归输出分类可能的概率。
得到的结果不同:分类算法得到是一个决策面,用于对数据集中的数据进行分类;回归算法得到是一个最优拟合线,这个线条可以最好的接近数据集中的各个点。
评估指标不同:分类经常使用准确率作为评价指标;回归中,我们用决定系数R平方来评估模型的好坏。R平方表示有多少百分比的y波动被回归线描述。

持续更新中。。。

  • 9
    点赞
  • 43
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值