趋势科技实习面试经历

2020年6月下旬投递了趋势科技实习岗位,含大数据分析,网络爬虫,机器学习等方向。整个面试包括等待时间一共近两小时,实际交流面试了一个小时。

笔者详细回忆了面试的过程用于自我反思,内容整理的比较繁杂,且笔者的回答不是正确答案,仅仅是还原当时的情景,具体答案笔者会给予链接,各位根据需求查看吧,希望能给大家带来一些帮助。

关于面试经验总结放在文章最后,可跳转查看。

面试前

(具体面试过程可跳转下文)
简历投递过后,两天内就收到面试邀请,因为笔者缺少面试经验,过去的一面是HR面试,此次也以为是人事面试,所以未做足面试准备,被打了个措手不及。

提前了近一个小时到达公司,公司8到14层,14层专用于面试,去的时候已经有不少人在参与面试了,但不是我投递的实习岗位,我被安排在一个落地窗房间等候,隐约听着隔壁全英文面试,着实让我很紧张,英语是我的致命点。

面试过程

一位不到30的小哥拿着笔记本电脑进入房间,向我打招呼,一眼能看出是技术人员,我知道这场面试不是我想的HR面而是技术面试了。相互客气几句后,我主动握手问好,他有些吃惊。

  1. 那我们开始吧,请先自我介绍吧
    面试官您好,我叫***,就读于***学校***专业,一直一来对大数据有浓厚兴趣,能够加入大数据行业也是我的梦想,为了实现这个梦想,我很早就着手准备,除了在相关课程取得优异成绩外,还自学了网络爬虫,R语言等工具作为知识储备,在校内也多次参与项目开发。(其实这里我的语气是很紧张的)

  2. 嗯,那我们先谈谈你的项目吧
    大一出于兴趣爱好,加入了老师带领的团队,多次参与中国机器人大赛并获奖

    (打断)具体做了哪些工作呢
    刚刚加入项目仅仅是完成分配的任务,后面包括方案策划,经费申请,比赛分析等都有负责。

    看简历有参与微信小程序开发是吗
    是的,4月份开始的

    才两个月啊,我手机可以打开看看吗?
    因为还没有上线,体验版,但我可以手机演示给您看。(接着给他演示了一遍)

    图像识别这块详细介绍一下
    (我详细介绍了我们小程序中图像处理接口的调用与使用,他也问的很细,他一边听着一边在简历上做记录)请问是公司的项目中涉及到这一块吗?

    嗯,我们有对图像进行对象识别的需求
    这个我们小程序使用的接口无法满足,但我曾经参与的一个课程设计中,就是对物体进行识别,通过数据训练好我们的模型,对图片或者视频进行识别,只要是我们训练好的,如这墙上的钟表,窗户等就可以识别出来。

    那需要训练好的模型,我们聊回你的项目吧,微信小程序这个项目,你具体做了哪些工作?
    首先是技术可行性分析,我主要负责图像识别,语音识别这块的验证。然后需求分析大家两天一会的形式讨论,具体开发中,****这一模块都是我做的,但我们存在技术嵌套,所以我负责的有部分别人也做处理,别人负责的也有我的一些处理。(这里的项目介绍我很差劲,没有向面试官表达出我的长处,如代码可读性高,文档能力好,善于与人协同合作等)

    这次项目使用的什么语言?
    node.js(接着他详细问了node.js的使用,如读取文件,信息传送等,我都答得糟糕,项目中没有涉及到这些,其实此时我应该发挥主动,绕开提问,介绍我js使用中的一些领悟,同时体现出自己学习能力强,善于接受新技术,这些都是项目需要所以快速上手使用,在此前还没接触过)
    Node.js
    Node.js读写文件

  3. 掌握python是吧,使用多久了?
    有近一年的时间

    那还是刚才那个问题,怎么读取文件,储存文件,python实现
    python可以使用相应的包直接读取的,对各类文件如csv,xls,text进行等save操作。
    python i/o 操作

    我这里打开了python3.7,怎么读取?要导入什么包吗?
    (我直接慌了,平时都使用pycharm,有提示的,且日常复制粘贴,让我直接命令行写代码,完全想不起来怎么拼写我思绪很乱杂乱说了一通)

    看简历你使用python做过一些数据处理是吧
    嗯,使用的,平时使用python做一些数据分析,可视化,也用python进行机器学习的练习,课程之外,出于兴趣也会用它进行一些处理,如这次疫情刚开始,我就用它分析微博热词如武汉,终南山等,画出折线图,看看能不能分析出什么。

    python进行可视化,要导入什么包吗?
    额,普通的可视化,要导入mat什么,抱歉拼写一时间想不起来了,简写plt,可做普通的数据可视化,python也能做更高级的一些可视化,需要导入另外一个包,比如我简历上的这个雷达图,其实就是我用python写的。
    可视化库:matplotlib
    更多高级可视化库

    嗯,好的,我们还有一个同事也要加入面试,一会儿来,我们接着聊啊,学过MySQL吗?
    以前有过MySQL的课程,平时的项目中也偶尔使用到,python里面也可以直接使用MySQL的(我这里是想说python中可以使用MySQL语句,没描述清楚太恐怖了)

    能直接使用?怎么用?
    需要导入包,好像就是MySQL包(我居然还认真回答了)
    python中连接MySQL数据库,导入包MySQL db

    (第二位面试官进来坐在了他旁边)我给你简单说一下吧,他参与过开发,做过一个微信小程序,(看着我)你给他介绍一下吧
    我给您演示一下(接着做了一下简单介绍,他并有太多兴趣,没问什么问题)

  4. 学过爬虫是吧?
    对,对大众点评网,深圳一个租房网等静态网页都有爬取过。

    怎么爬取的描述一下
    通过一个包,额,这个包的拼写我具体想不起来了,获取到网页的HTML,在通过beautifulsoup处理HTML文件,获取我们要的内容,比如我要获取房子的图片,那么就是在这个图片会有对应的div class ,而所有的住房图片应当都是一个样式,那么通过这些css标签就可以索引出我们要的所有租房图片。
    *网页请求库:requests
    网页解析库:BeautifulSoup
    html转markdown文件库:html2text

    爬取思路:我们爬取一份自己信息时往往带者许多的无用信息,这时我们应该一步一步的洗练我们爬取的信息,先截取出我们所需信息所在的大类中,然后从这个大类中慢慢取得自己所需的信息*

    如果页面出现卡顿,加载不出来怎么去排查
    (刚开始我没明白面试官意图,说了很多他不要的答案,多次交流后我才明白这个问题的目的)如果页面加载不出来或者卡顿,我会在获取页面的时候,将一些元素剔除掉,比如我把网页下的视频给剔除掉,不加载,看看效果,在剔除图片等,最后可以只获取txt,这样一步一步看效果排查问题(回答的真是糟糕)
    解决Scrapy爬虫卡(停)顿问题
    Web应用程序测试的工具selenium库

    简历上说了解网页爬虫原理是吧?描述一下
    (这里面试官想了解网页爬取的具体实现,我不是很明白,回答了对网络爬虫的看法)
    爬虫基本原理

    是计算机科学与技术专业,那你说一下如何请求并响应吧
    (我很模糊的回答了三次握手协议)
    浏览器请求响应过程

    不考虑ip,tcp协议,就说一下我发送请求,你和我之间怎么实现
    (这里应该是要结合网页爬取来讲)这个,不是很清楚呢,不过如果项目中需要,我应该能快速的了解它的原理。

  5. (另一位面试官接着问)看简历你使用过Hadoop,说一下job和&&吧
    (这里我完全没听懂面试官问的什么,多次交流后,让我说一说Hadoop的组件,我介绍了Hadoop的几个主要组件,面试官也一一详细问了原理和使用等,我很紧张,讲的的很凌乱)
    Hadoop

    介绍一下spark
    (这里对spark的介绍好了一些,面试官点了下头没再提问)

    你提到流式处理,详细说一下吧
    (我回答了它的一个原理,说了曾经使用的时候怎么用,用来做什么的,回答的不是很好,面试官发出了疑问“流式处理是这么用的么?”)

  6. 你有自己的博客吗?
    有的,平时遇到一些网上也没有的问题,解决后我会总结发布到csdn,知乎等平台。

    你账号是?我们看看你博客
    好,我账号,额,我忘记我账号了,平时都是自动登录。

    没关系

  7. 我们要问的大概就这些了,一直都是我们问,你有什么想问的吗?
    我知道大部分企业对实习生技术不放心,只是安排做一些简单的日常工作,如果我有幸加入贵公司,加入你们的项目,根据自己后期的表现,我有机会参与到实际的项目研发中吗?

    这是肯定的,我们有很多工作,虽然不是关键技术但也很重要的工作,需要你们不断去学习,研究
    哦,好的,其他的你们的同事都介绍的很清楚了,我没什么想问的了

    你是说HR吧?那行,面试结果HR会很快回复你的,感谢你对我们工作的支持

因为他们也要坐电梯去其他层,所以我们一路同行,他们问了现在疫情下我们学校怎么安排的,我和他们简单聊了两句,电梯里我问了公司有多少楼层等等问题。

总结经验

  1. 自我介绍要切合招聘需求,突出自己的亮点,强项,引导面试官对自己擅长的领域进行提问。
  2. 为了提高通过率,有亮点,简历我们可能注入了一些水分,但要注意言辞,简历上不可以把话说死,此外切合岗位需求,我们简历上有关的经历和知识点面试前一定要过一遍。
  3. 平时总结归纳的内容上传博客,笔者意识到这个问题的时候已经很晚了,博客上内容零零散散。如果你有自己的博客,一定不要像笔者一样,忘记了自己的账号这么尴尬。
  4. 除了回答面试官的问题外,要在回答中体现自己有良好的代码习惯,可读性高,有较强的文档能力,学习能力强等优势。

趁记忆还热乎,写这篇博客的时候还没有收到面试进一步的通知,我是不报希望了。作为一个面试失败者撰写面试经验,是比较可笑的吧。希望各位能从这篇博客中找到有价值的东西,祝大家前程似锦。

展开阅读全文

Python数据分析与挖掘

01-08
92讲视频课+16大项目实战+源码+¥800元课程礼包+讲师社群1V1答疑+社群闭门分享会=99元   为什么学习数据分析?       人工智能、大数据时代有什么技能是可以运用在各种行业的?数据分析就是。       从海量数据中获得别人看不见的信息,创业者可以通过数据分析来优化产品,营销人员可以通过数据分析改进营销策略,产品经理可以通过数据分析洞察用户习惯,金融从业者可以通过数据分析规避投资风险,程序员可以通过数据分析进一步挖掘出数据价值,它和编程一样,本质上也是一个工具,通过数据来对现实事物进行分析和识别的能力。不管你从事什么行业,掌握了数据分析能力,往往在其岗位上更有竞争力。    本课程共包含五大模块: 一、先导篇: 通过分析数据分析师的一天,让学员了解全面了解成为一个数据分析师的所有必修功法,对数据分析师不在迷惑。   二、基础篇: 围绕Python基础语法介绍、数据预处理、数据可视化以及数据分析与挖掘......这些核心技能模块展开,帮助你快速而全面的掌握和了解成为一个数据分析师的所有必修功法。   三、数据采集篇: 通过网络爬虫实战解决数据分析的必经之路:数据从何来的问题,讲解常见的爬虫套路并利用三大实战帮助学员扎实数据采集能力,避免没有数据可分析的尴尬。   四、分析工具篇: 讲解数据分析避不开的科学计算库Numpy、数据分析工具Pandas及常见可视化工具Matplotlib。   五、算法篇: 算法是数据分析的精华,课程精选10大算法,包括分类、聚类、预测3大类型,每个算法都从原理和案例两个角度学习,让你不仅能用起来,了解原理,还能知道为什么这么做。
©️2020 CSDN 皮肤主题: 1024 设计师: 上身试试 返回首页
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值