- 博客(1974)
- 资源 (385)
- 问答 (103)
- 收藏
- 关注
原创 【推荐系统】文本类的算法策略,有vs没有,比文本的排序,对线上转化重要的多
有展示vs没有,比候选文本的排序策略,对线上转化(比如CTR)重要的多。文本类的算法策略,比如推荐理由,搜索推荐词,搜索引导词/下拉词,
2024-10-20 14:58:25
101
原创 配置ESP32开发环境(thonny IDE,MicroPython)
在thonny IDE配置解释器,在同一个TAB里选择安装MicroPython,选择本地安装MicroPython的。下载MicroPython的Firmware。用USB线使PC连上ESP32芯片。
2024-10-18 20:50:53
204
原创 单片机和ROS的关系
(当然也有本身已支持ROS的接口和MoveIt!的机械臂,比如UR系列机械臂、KUKA机械臂、Fanuc机械臂、ABB机械臂)机械臂控制器支持ROS接口,以便于MoveIt!的运动方案通过ROS部署到机械臂执行。可以使用ESP32作为控制器来构建一个支持ROS接口的机械臂,负责制定机械臂的运动方案,
2024-10-17 10:27:00
191
原创 Mac,pip3 install ./ml-agents,报错 Could not find cmake executable!
【代码】Mac,pip3 install ./ml-agents,报错 Could not find cmake executable!
2024-10-08 11:58:25
141
原创 思维链CoT / 检索增强生成RAG,来调用ChatGPT,有效的原因
prompt相当于模型的输入的特征。自己训练一个模型,也是希望特征在正确的前提下越多越好。在prompt本身正确的前提下,肯定是prompt输入越多,ChatGPT回复的越准,
2024-10-07 11:34:26
79
原创 【搜索算法】做query标签 vs 做item标签 for扩召回
做query理解/标签 容易出效果,query之前没有同义词 纠错词等标签,相当于从零做,或者优化之前的query标签,而item之前已有很准的“标签”也就是item名称分词的结果。
2024-10-06 22:33:46
124
原创 【搜索算法】以扩召回为目标,item-tag不如query-tag能扩更多数量
如果扩召回的逻辑是:query-tag等于item-tag时,输入query召回该item,那么每个query-tag可平均召回500个item,,(1-item --> 1tag --> 1500query),如果想给item挖掘tag打上,每个item要挖掘1500个tag之多!如果item类目体系一共20个类目,每个item都有一个类目,一共有10000个item,则平均每个类目tag下有500个item,,如果一共30000个query,那么。那么给每个query打上一个类目,
2024-09-16 08:12:20
312
原创 hive sql, stringCol1 contains stringCol2
【代码】hive sql, stringColumn1 contains stringColumn2。
2024-09-14 19:53:50
170
原创 huggingface transformers 报错 ‘list‘ object has no attribute ‘size‘
已经是python list类型,
2024-09-06 16:21:57
107
原创 使用中文tokenizer和BlipForConditionalGeneration实现中文image caption
【代码】使用Blip的预训练好的imageEncoder并替换其decoder。
2024-09-01 19:54:28
192
原创 调用Blip image tokenizer实现image2text
【代码】调用Blip image tokenizer实现image2text。
2024-08-22 22:14:28
174
原创 VQ-VAE的 image tokenizer 的原理
VQ-VAE 里的 vector quatization。简单来说,就是要先有一个codebook,这个codebook是一个embedding table。我们在这个embedding table中找到和vector最接近(比如欧氏距离最近)的一个embedding,用这个embedding的index来代表这个vector,就实现了把一个vector表示成离散的token-id。可见这种image tokenizer的方式出来的token词典,肯定是只适用于训练时的图片数据集的。
2024-08-21 09:19:58
208
原创 【推荐系统】精简特征的意义
前文 https://blog.csdn.net/guotong1988/article/details/140605537。有100个特征,如果线上每个特征出问题的几率是1%,那么100个特征都不出问题的概率就是0.99^100,有200个特征,如果线上每个特征出问题的几率是1%,那么200个特征都不出问题的概率就是0.99^200,比如原来10个特征,每个成功率99%,现在合并成1个特征,成功率也是99%,不就相当于提升了整体成功率。
2024-08-07 10:01:40
171
原创 Practice Lessons for AI Applications
Rule-based data cleaning is very important in rule-match and fuzzy-match algorithm.Everything is classification, so classification solves all. Also, everything is mapping to another dimension to be understand.What is mapping? Mapping solves all:text-mapTo
2024-08-05 21:35:28
86
原创 Three basic starting points to do AI
Computers have been based on memory/storage for so many years. Don’t try to come up with something else.For so many years, AI has been based on fixed precise rules or fuzzy matching rules. Don’t think about coming up with the third one by yourself.View dee
2024-08-01 09:58:47
278
原创 GPT4 > 搜索引擎,如同 向量召回(做得好的话) > BM25文本召回
所以向量召回的结果起码会是BM25文本召回的补充。向量召回(做得好的话)的结果是。BM25文本召回的结果是。
2024-07-24 14:24:53
84
原创 多国语言的词根提取
下载libstemmer-java(https://download.csdn.net/download/guotong1988/89574039)解压,把整个目录放到IDE里。
2024-07-24 11:36:23
59
原创 Spark报错,Task not serializable
objectA调用了objectB里面的一个方法methodB。objectB也调了objectA里面的一个方法methodA。可能是有两个Object:objectA,objectB。
2024-07-23 15:02:59
93
原创 【NLP】提升文本生成多样性的实用方法
可以每训练3个epoch保存一个模型参数,最终可保存5个模型参数,预测时5个模型结果分别 对同样的输入文本 各预测一次,如果只有几千条fine-tune数据,实测可提升50%的多样生成结果。
2024-07-22 11:09:37
297
torch-1.13.1+cu117-cp38-cp38-linux-x86-64.whl
2024-12-20
torch-2.0.0+cu118-cp38-cp38-linux-x86-64.whl的zip-2/2
2024-12-19
torch-2.0.0+cu118-cp38-cp38-linux-x86-64.whl的zip-1/2
2024-12-19
depth-anything/Depth-Anything-V2-Base-hf
2024-11-08
torchvision-0.19.1+cu118-cp38-cp38-linux-x86-64.whl
2024-10-29
huggingface.co/Salesforce/blip-image-captioning-base
2024-08-22
Qwen2-7B 的 model-00004-of-00004.safetensors 的2/2
2024-07-29
Qwen2-7B 的 model-00004-of-00004.safetensors 的1/2
2024-07-29
Qwen2-7B 的 model-00003-of-00004.safetensors 的2/2
2024-07-29
Qwen2-7B 的 model-00003-of-00004.safetensors 的1/2
2024-07-29
Qwen2-7B 的 model-00002-of-00004.safetensors 的2/2
2024-07-28
Qwen2-7B 的 model-00002-of-00004.safetensors 的1/2
2024-07-28
Qwen2-7B 的 model-00001-of-00004.safetensors 的2/2
2024-07-28
Qwen2-7B 的 model-00001-of-00004.safetensors 的1/2
2024-07-28
Qwen2-7B-Instruct 的 model-00004-of-00004.safetensors 的2/2
2024-07-26
Qwen2-7B-Instruct 的 model-00004-of-00004.safetensors 的1/2
2024-07-26
Qwen2-7B-Instruct 的 model-00003-of-00004.safetensors 的2/2
2024-07-26
Qwen2-7B-Instruct 的 model-00003-of-00004.safetensors 的1/2
2024-07-26
Qwen2-7B-Instruct 的 model-00002-of-00004.safetensors 的2/2
2024-07-26
Qwen2-7B-Instruct 的 model-00002-of-00004.safetensors 的1/2
2024-07-26
Qwen2-7B-Instruct 的 model-00001-of-00004.safetensors 的2/2
2024-07-25
Qwen2-7B-Instruct 的 model-00001-of-00004.safetensors 的1/2
2024-07-25
torch-2.3.0+cu118-cp38-cp38-linux-x86-64.whl
2024-06-24
meta-llama-3-8b-instruct 的 model-00004-of-00004.safetensors
2024-05-29
meta-llama-3-8b-instruct 的 model-00003-of-00004.safetensors 的3/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00003-of-00004.safetensors 的2/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00003-of-00004.safetensors 的1/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00002-of-00004.safetensors 的3/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00002-of-00004.safetensors 的2/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00002-of-00004.safetensors 的1/3
2024-05-29
自动驾驶,如何得到方向盘转动的ground truth?
2024-03-18
AlphaGo能超越人类,因为训练时 对于模型的每个输入,都有一个100%正确的答案?
2024-01-16
其实LLM/ChatGPT是否在距离AlphaGo式AI越来越远?
2024-01-16
技术上,ChatGPT要成为 AI医生/AI律师/AI教师 还欠缺哪些能力?
2024-01-11
数学 是且仅是 一种语言和一种工具,不是科学的全部?
2023-12-14
哪些时候用CUDA编程更好?
2023-12-14
用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?
2022-05-07
没有物理机器人载体,如何在模拟环境里的进行学习和研究机器人?
2022-04-28
2022年了,USB式GPU有哪些进展?
2022-04-28
2022年了,有哪些稳压deepfm的CTR模型?
2022-04-01
CTR模型,如果上线了没效果,这时可以进行哪些分析工作?以及有无必要投入大量时间分析?
2022-03-24
算法工程师如何应对做算法策略的不确定性;比如没效果,这时绩效怎么保证?
2022-03-01
CTR模型必须要有一个测试数据集吗? 训练数据集和测试数据集是同一个,可以吗?
2022-02-25
为啥我感觉现在机器学习模型就是一种模糊匹配工具or相似识别工具?
2022-02-16
因果推断技术靠谱吗,感觉里面的影响因素太多了,所以能实际解决落地问题吗?
2022-02-08
XGB/GBDT/决策树,得出特征重要性的原理是什么?
2022-02-08
强化学习是不是无人驾驶的未来?
2022-02-01
GAN生成图像,弄一个discriminator ,和无D直接生成,区别是?
2022-02-01
哪些互联网公司的管理职级和专业职级是分开的?
2022-01-22
CTR模型的AUC如果比较高,是否其实只是 因为复购行为带来的AUC虚高?
2022-01-17
CTR模型的本质是不是算出 user的哪些特征和item的哪些特征 最匹配?
2022-01-08
人工智能的因果学习(Causal Learning)到底想解决什么问题?
2021-12-17
BYOL里stop-gradient的作用是什么?
2021-12-01
马上2022年了,强化学习+NLP 有了哪些突破?
2021-11-26
马上2022年了,pointer-network现在看来的作用是什么?
2021-11-26
总被主管说文档写的不好怎么办?
2021-11-18
NER任务只有一个类的情况下,BME或者Yes-No的数据预处理方式对结果有影响吗?
2021-11-08
学好数学对于编程的真实增益的性价比到底如何?
2021-11-03
学好数学对于编程的真实增益到底是多少?
2021-11-03
如果说每一个数学公式都在描述一件事情,那么数学公式的推导,是在做什么?
2021-10-26
每个物理公式是否都是在【描述】一个事情?
2021-10-12
求通俗讲讲数学或理论物理进行研究的细节,复杂公式是不是也都是由基础公式而来?
2021-09-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅