关闭

2007年9月17日百度一面

576人阅读 评论(0) 收藏 举报

   今天下午5点在天大东门对面的上岛咖啡进行了本人找工作以来的第一场面试。
   面试官很nice,不过我还是有些紧张^_^。
   面试进行了一个小时,面试官先让我说说自己做的项目,由于他对一个项目中的垃圾邮件文本比对算法很感兴趣,所以直接就从这里开始发问(是在我介绍项目的过程中发问,逐渐脱离项目):
   1.你是不是对文本匹配领域比较熟悉?答:凑合
   2.那你说说文本分类聚类?哑然(忘了)(简单地说:聚类--是“无监督学习”,事先不知道将要分成哪些类。分类--是“监督学习”,事先知道有哪些类别可以分。)

   3.从10万规模的URL串中去重复?回答得不好,复杂度没达到要求。(我们需要对URL进行划分,分成几个部分(域名、一层地址、二层地址...),首先将域名hash到n个桶里,比较同一桶里的URL,如果相同,去除之
   4.两个百万规模的数组(只有英文小写字母)找共同串

   面试结果不好,我还须努力才行。
   冷静地面对一切! 

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:20654次
    • 积分:370
    • 等级:
    • 排名:千里之外
    • 原创:15篇
    • 转载:1篇
    • 译文:0篇
    • 评论:1条
    最新评论