小李飞刀李寻欢
视频号:小明哥直播间
展开
-
python LLM大模型实现OneAPI接口
大模型统一接口API设置原创 2024-05-17 17:32:04 · 128 阅读 · 0 评论 -
GPT-4o流式数据处理 Extra data: line 3 column 1 (char 254
GPT-4o流式数据处理,二次转发原创 2024-05-17 16:50:05 · 563 阅读 · 0 评论 -
大模型在法律方面的应用及方案
大模型在法律行业的应用及落地方案原创 2024-04-17 18:16:35 · 263 阅读 · 0 评论 -
pdf拆分成各个小pdf的方法
pdf拆分原创 2024-01-17 17:58:26 · 419 阅读 · 0 评论 -
AttributeError: ‘ChatGLMModel‘ object has no attribute ‘prefix_encoder‘
ChatGLM-6B微调之Lora版本原创 2023-10-08 17:46:46 · 1144 阅读 · 0 评论 -
大数据向量检索的细节问题
基于亿级高纬度向量数据的检索原创 2023-08-21 17:55:45 · 712 阅读 · 0 评论 -
OpenWebtext数据集
用于GPT2文本生成的OpenWebtext数据集。原创 2023-07-26 10:56:50 · 872 阅读 · 0 评论 -
基于清华chatglm-6b模型的向量化检索问答
基于本地知识库的智能问答。原创 2023-06-13 16:18:35 · 1495 阅读 · 0 评论 -
query与doc的相关性模型gensim
query与doc的相关性demo,测试了title为doc时的相关性,效果较差,因为doc与query之间是不同纬度,query中的词在doc并不会出现,所以很难做。原创 2023-05-12 10:50:12 · 291 阅读 · 0 评论 -
推荐算法再次踩坑记录
推荐算法tf-serving部署服务,docker部署CPU,GPU都可以。原创 2023-03-17 19:39:30 · 1849 阅读 · 2 评论 -
如何做召回dssm,fm,Mind,youtube等模型
推荐算法之召回模型SDM,DSSM,FM,MIND,YouTubeDNN模型原创 2023-03-31 15:37:41 · 589 阅读 · 1 评论 -
对话大模型体验(最后附源码)
chatgpt国内版本初步上线(仅供参考)原创 2023-03-15 15:42:43 · 1163 阅读 · 1 评论 -
信息抽取UIE
信息抽取中的事件抽取原创 2023-03-07 10:49:29 · 989 阅读 · 2 评论 -
Bert文本聚类实践
文本聚类探索与实践,文本分类用于聚类能行么?原创 2023-02-10 10:00:11 · 1333 阅读 · 0 评论 -
NLP 工作中bug记录
bug记录-自然语言处理原创 2023-01-09 14:09:37 · 683 阅读 · 0 评论 -
sentence Bert解读及代码示例
SBERT论文详解并附代码。STS任务原创 2022-12-08 23:24:37 · 1169 阅读 · 4 评论 -
Bert论文解读及相关代码实践
bert论文解读及微调方法原创 2022-12-08 12:31:29 · 698 阅读 · 0 评论 -
信息抽取/实体关系抽取之UIE
飞酱NLP之信息抽取,知识抽取,关系抽取UIE原创 2022-12-06 16:34:12 · 4846 阅读 · 2 评论 -
fastTEXT论文解读并附实例代码
fastTEXT如何做压缩的原创 2022-12-03 16:39:53 · 880 阅读 · 0 评论 -
NLP基本业务范围之二
NLP基本业务:阅读理解,因果模型,文本生成,翻译原创 2022-12-02 15:12:20 · 1287 阅读 · 0 评论 -
NLP基本业务范围
NLP基本业务,纠错,掩蔽词MASK,NER,情感分析,文本摘要原创 2022-11-30 19:19:52 · 712 阅读 · 0 评论 -
fastTEXT入门自然语言处理NLP
fastTEXT自然语言处理,词向量,文本分类原创 2022-11-27 23:11:29 · 823 阅读 · 0 评论 -
广告算法相关概念及基础知识
广告算法基本概念原创 2022-10-20 15:47:52 · 2676 阅读 · 0 评论 -
推荐算法面经之八股文
推荐算法八股文,必看原创 2022-10-13 16:46:10 · 1546 阅读 · 0 评论 -
spark基本数据处理之推荐数据movielens
java-spark-SQL数据处理,主要用java写的,将SQL转换成java表达原创 2022-09-23 01:26:28 · 379 阅读 · 0 评论 -
spark使用之ALS版本对比
用spark进行ALS推荐原创 2022-10-19 13:58:15 · 1014 阅读 · 0 评论 -
deepFM排序模型与wide&deep的差异
wide&deep和deepFM有啥不同原创 2022-06-30 15:18:05 · 781 阅读 · 0 评论 -
ESMM全空间多任务模型解读与试验
ESMM模型排序及服务部署。原创 2022-06-28 20:31:10 · 621 阅读 · 0 评论 -
tf.data及tf.io数据解析及数据格式转换
由之前的数据存储格式tfrecord,那么在解析raw_data的时候可以使用io(io就是input和ouput)下面的函数进行处理,如下示例,For Recommendation in Deep learning QQ Group 277356808For deep learning QQ Second Group 629530787I'm here waiting for you1-离散特征tf.feature_column.categorical_column_with_hash_.原创 2022-04-06 13:58:32 · 1358 阅读 · 0 评论 -
wide&deep模型几个问题的思考
wide deep模型的几个问题思考原创 2022-04-06 13:56:10 · 457 阅读 · 0 评论 -
tf-serving部署之踩坑记录
tf-serving部署原创 2022-03-18 15:41:43 · 2887 阅读 · 1 评论 -
排序中的数据格式tfrecord存储及读取
tfrecord读写点击曝光数据原创 2022-03-12 18:16:41 · 717 阅读 · 0 评论 -
hive-SQL学习笔记12
SQL高级查询方法及条件设置原创 2022-03-08 19:05:02 · 2586 阅读 · 0 评论 -
hive-SQL学习笔记11
之前有人问我,如何挑出一个月的最大值及其特征,比如有三列,分别是user_id,item_id,time,其中time是停留时长,这个问题就是找出这个用户,他这一行是什么,我当时就懵逼了。我说我直接全部拉下来这个月的数据,然后py操作取最大值即可。。。game overFor Recommendation in Deep learning QQ Group 277356808For deep learning QQ Second Group 629530787I'm here waiting f原创 2022-03-02 17:58:09 · 3464 阅读 · 0 评论 -
lightgbm调参经验
gbdt调参如何优化原创 2022-02-23 14:46:32 · 906 阅读 · 0 评论 -
点击曝光日志的数据处理
点击曝光日志的基本处理方法原创 2022-02-11 14:33:43 · 2600 阅读 · 0 评论 -
召回模型优化记录
hi各位大佬好,我是你最爱的小明哥。这周主要任务是新增召回特征,据可靠信息,某个特征相当牛逼,单独即可发挥相当不错的效果,线上CTR是最好的,目前本大佬进行一个测试,只有这个特征的与纯ID特征的进行对比。大佬们,看完投个票呗。For Recommendation in Deep learning QQ Group 102948747For deep learning QQ Second Group 629530787I'm here waiting for you不接受这个网页的私聊/私信!!!..原创 2021-12-23 15:20:01 · 1327 阅读 · 0 评论 -
DIN数据处理与理解
hi各位大佬好,我是小明哥,节后及年前的工作是排序,从此以后的重点也是排序。召回排序,只做其一被人看轻,所以都要会,然后全面深入。For Recommendation in Deep learning QQ Group 277356808For deep learning QQ Second Group 629530787I'm here waiting for you不接受这个网页的私聊/私信!!!欢迎关注微信视频号、快手:小明哥直播间1-训练数据的构成点击序列依旧是关键词,到哪都是原创 2021-10-18 15:44:49 · 645 阅读 · 0 评论 -
关于召回模型及策略的研究进展
hi各位大佬好,我是菜鸟小明哥。近期,召回模型在客户端(千万DAU)表现(CTR)跌宕起伏,犹如过山车,一段时间效果相当好,一段时间跌入谷底,与股市相似,但不同的是,CTR始终在某一数值上下浮动(范围不大),这个数值我称之为“平流层”。作者简介:小李飞刀李寻欢,负责客户推荐工作。声明:本文不针对任何人,就事论事。有事群里骂我来。For Recommendation in Deep learning QQ Second Group 1029487471-attention与transforme原创 2021-09-17 17:11:24 · 406 阅读 · 0 评论 -
关于负采样tf.nn.nce_loss
hi各位大佬好,之前关注的是sampled_softmax_loss,然而负采样的方法并不是只有一两个,其实很多,但tf自带的不多,考虑到效率及效果问题,先采用tf自带函数,那么本篇就探索另一个负采样,即NCE。【本文效果提升明显,不便公开】For Recommendation in Deep learning QQ Second Group 102948747For Visual in deep learning QQ Group 629530787I'm here waiting for you原创 2021-09-15 14:41:21 · 505 阅读 · 0 评论