面试经历8.3 珠海小作坊

最新推荐文章于 2024-11-10 14:57:19 发布

dd_bot

最新推荐文章于 2024-11-10 14:57:19 发布

阅读量127

点赞数

文章标签：面试职场和发展

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_54444389/article/details/131986142

版权

文章讲述了作者的面试经历，涉及AIGC算法实习，包括BERT模型在中药医学文本处理中的应用，GPT2模型的理解，以及Transformer编码器的工作原理。面试中还讨论了ChatGPT、预训练、提示词编写、模型选择和代码问题的解决策略。

摘要由CSDN通过智能技术生成

面试经历1珠海小作坊AIGC算法实习生

1.自我介绍：

答：问好，介绍教育经历，有三段实习经历，且发过一篇论文。

2.问：介绍一下你发表的论文：

答：这个论文是关于中药医学说明书文本的实体识别，本人做了bert模型预训练，中药医学说明书文本数据的预处理。

3.问：那说一下你是怎么处理这个数据集的：

答：处理中药医学说明书文本的数据集主要是用了BIO标签标注用jieba分词工具分词，并且对数据集进行中译再译中的数据增量处理（称为回译的方式）。

4.问：你还做了关于gpt2的项目，能讲一下gpt2模型吗：

答：gpt2模型是transformer的encoder部分（答错应该是decoder部分）。

5.问：那你能讲一下encoder是由什么组成的吗：

答：encoder部分是由很多个block组成，block里由self-attention的输出输入到一个fully connected 的network里。

6.问：你能讲一下chatgpt的基本吗？

答：chatgpt是transformer的encoder和decoder部分组成（应答chatgpt由以下几个原理组成1.Tokenization分词器，2.Transformer模型的encoder和decoder部分3.大规模的无监督学习方式进行预训练4.进行微调来适应不同的场景5.beam search算法来选择最佳的n个候选回复，选择得分最高的作为最终回复）

7.问：你要是做一个中文文本语言模型你会怎么做？

答：我会将一段文本进行分段，即一段文本一部分为中文，一部分为英文，输入模型，这样预训练的效果会更佳。

8.问：你说的是预训练部分，除了预训练部分你还有什么措施吗？

答：除了预训练部分就是选用分词器（后面回答的忘记了，分词器，模型选择，预训练，微调都可以说）

9.问：那你有了解过别的大语言模型吗：

答：主要涉猎的是bert，gpt2，最近在github上下载openai的开源项目来做一下。

10.问：那你了解提示词的编写吗：

答：最近有在看一些教程处于学习阶段。

11.问：那你能说一下prompts的具体应用吗：

答：一开始没理解问题，回答prompts的应用还是很多的可以编写代码，文档，文案等，（其实他是像我回答prompts的应用场景，应用场景有问答问题，基于示例回答，增加示例，推理，写无中生有的如代码，锦上添花的如改写内容，增加角色或人物，锦上添花的信息解释，化繁为简的信息总结和信息提取，当时只答出来了增加角色和信息解释）

12.问：那如果想让chatgpt运行精密的计算题应该用什么样的技巧：

答：可以增加角色，让其认为自己是数学老师，（应答可以使用推理的技巧，后面让技术老师更正了）

13.问：那如果让你编写prompts，你觉得怎么编写的效率会比较高呢：

答：我认为应该通过固定的框架来写，最必要的题目的Instruction指令的描述，可以选填一些背景信息则是上下文信息，选择一些输入的数据，告知模型需要处理的数据，选填output Indicator，告知模型我们要输出的类型和格式。

14.问：chatgpt的回答是比较发散的如果你想让其有固定的回答方式你会怎么做：

答：可以给chatgpt举出例子，一个问题，一个回答的示例，最后问出自己想问的问题，然后让chatgpt回答。

15.问：看你的简历你还用resnet-50模型训练过，能说一下是怎么做的吗：

答：我是用图片作为输入，经过预处理后图片输入到resnet-50的模型中让其进行眼部的部位识别。

16.问：那你能说一下你是怎么进行预处理的吗：

答：我们对图片进行部位的标注，还有对图片进行降噪处理。

17.问：为什么不选用别的模型：

答：当时还是大一新生，只是跟着做这一项目。

18.问：代码题，如果给你一个无序数组怎么样处理呢：

答：暴力方法就是两个for循环就可以处理了，还可以使用双指针法，使用快指针和慢指针，快指针往前走的时候通过对慢指针进行比较，如果快指针比慢指针小的话，就对就把快指针的值赋给慢指针。

19.问：那这样处理的时间用了多少：

答：O(n).

20.问：那这样快慢指针只走一次就可以排好序吗：

答：是的，（后面被质疑了，这题答错了）

21.问：代码题，链表如果有环，应该怎么样判断：

答：使用快慢指针，快指针走两步，慢指针走一步，若快指针直接null就没有环，如果有环快慢指针就总会相等。

22.问：那快指针就是比慢指针快一步的话，为什么会相等呢？

答：（没能答出来，但是现在想想如果是一个环，快慢指针类比跑圈里跑得快和跑得慢的两个人，那就是能相遇的。）

总结：算法模型原理记忆的不够熟悉，代码题目只是背诵解法不够了解原理，代码的处理的时间和空间也不熟悉，大语言模型了解的不够多，prompts不够深入。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

dd_bot CSDN认证博客专家 CSDN认证企业博客

码龄4年

27: 原创

151万+: 周排名

140万+: 总排名

2126: 访问

: 等级

274: 积分

0: 粉丝

0: 获赞

12: 评论

0: 收藏

私信

关注

热门文章

最新评论

代码随想录 Day3
CSDN-Ada助手: “恭喜你写了第8篇博客，标题为‘代码随想录 Day3’，真的很厉害！能够坚持写作并分享自己的想法，展现了你对于代码和思考的热爱和专注。希望你能继续保持创作的热情，并且不断拓展自己的写作领域，可以尝试一些技术分享、项目实践等方面的内容，让读者可以更直观地了解你的想法和成长过程。希望你能继续保持谦虚的态度，不断学习和进步，期待你的更多精彩文章。”
代码随想录 Day4
CSDN-Ada助手: 恭喜您持续创作，第9篇博客内容丰富，让人受益匪浅。希望您在接下来的创作中可以更多地分享自己对代码的思考和体会，或者结合实际案例进行分析，这样可以让读者更加深入地理解和学习。期待您的下一篇作品！
代码随想录Day8 Day9
CSDN-Ada助手: 恭喜您写了第12篇博客！看到您坚持不懈地分享自己的代码随想，真的很值得称赞。希望您能继续保持创作的热情，不断学习、积累，也许可以尝试写一些关于实际应用的案例分析，或者分享一些解决问题的心得体会，这样能够让更多的读者受益。期待您的下一篇作品！
代码随想录Day10 Day11
CSDN-Ada助手: 恭喜你持续创作，第13篇博客内容丰富，让人受益匪浅。对于接下来的创作，我建议你可以尝试更多的实际案例分析，或是深入探讨某一技术点，让读者能够更深入地了解你的见解。希望你能继续保持创作的热情，为我们带来更多精彩的内容。
代码随想录笔记Day13-二叉树的递归遍历
CSDN-Ada助手: 恭喜用户在博客中分享了第16篇文章！标题为“代码随想录笔记Day13-二叉树的递归遍历”，我非常欣赏你对于二叉树递归遍历的深入探讨。你的博客内容一直都充满了洞察力和扎实的知识，让读者们受益匪浅。在下一步的创作中，我想提供一个建议，希望你能够进一步探索不同类型的树结构，并分享其递归遍历的实现方法。例如，红黑树、AVL树等等，这些树结构在实际开发中也非常重要。通过深入研究和分享，你将能够帮助读者们更好地理解这些数据结构的原理和应用。继续保持谦虚的态度和热情，相信你一定会在未来的创作中取得更大的成就。期待你的下一篇博客，再次恭喜你的努力和成果！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。