NLP
文章平均质量分 53
cyong888
这个作者很懒,什么都没留下…
展开
-
pytorch常用的函数
1.nn.Linear 全连接https://www.jianshu.com/p/c6eabe6f69b12. nn.Conv2d 卷积https://blog.csdn.net/sunny_xsc1994/article/details/82969867https://www.jianshu.com/p/45a26d2784733.nn.MaxPool1d原创 2021-01-07 12:32:40 · 138 阅读 · 0 评论 -
textcnn 的例子 用 Pytorch
1. 抽取训练数据 和 验证集 5:12. 生产词表:0 开始 ;同时统计每个句子的term数量3. kernel_size= {2,3,4} 就是3个模板,分布式 2* n,3 *n, 4*n4.kernel_num 是卷积输出channel数原创 2021-01-04 16:28:00 · 237 阅读 · 0 评论 -
团-搜索-面20201230
团-搜索-面文本分类:样本失衡,如何解决focalloss的原理是什么?具体使用如何做?向量召回 :一般有哪些方法?facebook的 faiss的原理是什么?bert 为什么比lstm好?selfattention的原理bert 比 transform还多哪些东西?完形填空部分,训练的是什么?...原创 2020-12-31 11:19:19 · 101 阅读 · 0 评论 -
美团外卖/滴滴20201225面试
1. ANN的原理,即向量召回的原理2. gbdt的原理,最好能涉及到公式的维度3. gbdt 如何优化变快4.原创 2020-12-25 19:05:07 · 161 阅读 · 0 评论 -
kuai手搜索广告面试题20201214
1. 数组的排列组合输出,譬如数组的值为123,那么输出为:123 132 213 231 321 3122. 编辑距离的算法 这个要用到 动态规划,需要多看看3. Top K的问题,当有一个数组 里面有很多值N个,我希望选出top K个值。 3.1 思路 先排序,这样可以,不过时间复杂度很高 3.2 建立小堆。 3.2.1 给N个值建立 小堆,此时时间复杂度是 K * logN。 3.2.2 给前面K个值建立小堆,然后 N-K的数字依次进入这个小堆,...原创 2020-12-15 16:52:28 · 183 阅读 · 0 评论 -
GBDT的使用例子
1.需要按照numpy 和 sklearn,安装的时候会有各种包的依赖。建议安装 anaconda3,这样就全部安装好了。安装地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/2.python3的代码如下(和python2差不多)3.训练速度特别快,100W的训练数据不到5分钟。# -*- coding:utf-8 -*-import numpy as npimport codecsimport picklefrom skl.原创 2020-06-10 10:18:45 · 1258 阅读 · 0 评论