[夏令营]——东南大学计科院&PALM实验室夏令营随笔

7/29开营

在这里插入图片描述
PALM

  • 周毅和陈浩老师合作很多
  • 徐宁老师
  • 周德宇老师:
    在这里插入图片描述

后面没听

7/29晚自己准备的一些问题

  • 为什么来东南?
  • 对人工智能的理解?
  • NP?
  • 蓝桥杯、CCF主要用了什么算法?
  • 说一下DIORA
  • 说一下consituent parsing
  • 说一下F1值的计算
    • 2精确率召回率/(精确率+召回率)
    • 精确率:预测出来是正样本中,预测正确的比例
    • 召回率:所有正样本中,你预测出来的比例
    • 精确度:预测正确的占总样本的比例
  • 说一下BERT
  • 说一下word2vec
  • 机器学习算法
  • 说一下tf-idf
  • 说一下GCN
    • rayleighquottent
    • https://www.bilibili.com/video/BV1Vw411R7Fj?p=1

7/30PALM面试

5分钟PPT。
问了项目相关的几个问题
问我怎么评价自己的数学
问我怎么评价自己的编程能力
问我现有的offer,我实话说了
问我是不是100%要来(这应该是他的必问项目)我没答好:我居然说我需要跟我爸妈商量,我也不知道老师第几次听到这个愚蠢的回答了(((
我觉得正确的回答是:
老师,我读研究生的目的不是为了学校的title、好让我毕业找一个好的工作,我就想做科研,我就想做NLP。所以我现在还不能完全决定,如果可以,我希望可以和老师您细聊,我想了解老师人为以及老师对我之后学习的建议、规划之后,再做这个对我来说非常重要的决定。
非常不安,于是半夜给周老师发了邮件,说自己如果能来,一定来,也是为了offer不管不顾了。老师的回复还是比较正面的,让我好好准备学院面试,然后才能给我"安排工作"(这应该就是offer的意思吧)。

8/7 学院面试

  1. ppt介绍
  2. Can you give us some details on the project and how did you finish the project and which part you have done?
  3. 再详细一点介绍项目?
    实验部分:textseg、transformer…都是前人的工作,所以将他们的代码搬到我们的任务上。工作量比较大的是我们提出的模型。因为之前没有工作把图卷积神经网络用在话题分割,所在在前期调研了一些相关工作,当然是在其它的任务上,就需要去看懂他们工作的代码,然后设计出图卷积神经网络在我们任务上的具体实现。
    写作部分:
  4. 你为什么能够同时跟三个老师在做项目?
    第一点,省级的大创项目由于是五个同学一起在做,所以压力比较小。主要就是上科大和本校的项目,但任务也比较重。所以我就想着尽可能地去发现这两份工作的共同点,就比如上科大探究的就是一种树形结构的模型,那么我就想着把这种模型也尝试了用在我们自己的任务上。而最后的图神经网络的句子编码方式,也是从一开始的这个想法衍生出来的。
  5. 项目中前人工作中的问题?
    句子编码能力的不足,模型复杂度较高,就比如一些transformer的模型,他都不能完整地装下一个篇章,需要做一些切割
  6. 你多久想出的这个idea?
  7. 你上过NLP相关的课程吗?
  8. 你没有上过NLP相关的课程,那你为什么要参与NLP相关的项目?
  9. 那你介绍一下TF-IDF?
    TF-IDF=TF*IDF,其中TF表示单词在当前文本中的频率,IDF是log(单词出现在文本的个数/总文本的个数)
  10. TF-IDF需要得到句子的向量表示么?

结果

不合格(288/300+…可以说是垫底)

  • 18
    点赞
  • 92
    收藏
    觉得还不错? 一键收藏
  • 18
    评论
pandas中的groupby函数用于按照指定的列对数据集进行分组,并对每个分组进行特定的操作。groupby函数的基本语法为: ```python df.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs) ``` 其中,by参数用于指定分组依据的列名或列名列表;axis参数用于指定分组的轴向,默认为0,表示按照行进行分组;level参数用于多层索引时指定分组的级别;as_index参数用于指定分组后的结果是否以分组列作为索引;sort参数用于指定分组后的结果是否按照分组列排序;group_keys参数用于指定是否在分组后的结果中保留分组键;squeeze参数用于指定是否在分组后的结果中压缩单一分组的维度。 groupby函数返回的是一个GroupBy对象,可以对该对象进行多种操作,例如聚合、过滤、变换等。常用的聚合函数包括sum、mean、count、max、min等。groupby函数的原理是先将数据按照行或列进行分组,然后对每个分组进行特定的操作,并将结果合并成一个新的数据集。在实现上,groupby函数使用了split-apply-combine的策略,即先将数据集拆分成多个小组,然后对每个小组进行操作,最后将结果合并成一个新的数据集。 需要注意的是,groupby函数并不会改变原始的数据集,而是返回一个新的数据集,因此在使用groupby函数时需要注意将结果保存到变量中。另外,groupby函数对于大型数据集的性能较低,因此在处理大型数据集时需要谨慎使用。
评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值