自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Talk Is Cheap

If You Get Tired, Learn To Rest, Not To Quit

  • 博客(1974)
  • 资源 (385)
  • 问答 (103)
  • 收藏
  • 关注

原创 【推荐系统】文本类的算法策略,有vs没有,比文本的排序,对线上转化重要的多

有展示vs没有,比候选文本的排序策略,对线上转化(比如CTR)重要的多。文本类的算法策略,比如推荐理由,搜索推荐词,搜索引导词/下拉词,

2024-10-20 14:58:25 101

原创 配置ESP32开发环境(thonny IDE,MicroPython)

在thonny IDE配置解释器,在同一个TAB里选择安装MicroPython,选择本地安装MicroPython的。下载MicroPython的Firmware。用USB线使PC连上ESP32芯片。

2024-10-18 20:50:53 204

原创 单片机和ROS的关系

(当然也有本身已支持ROS的接口和MoveIt!的机械臂,比如UR系列机械臂、KUKA机械臂、Fanuc机械臂、ABB机械臂)机械臂控制器支持ROS接口,以便于MoveIt!的运动方案通过ROS部署到机械臂执行。可以使用ESP32作为控制器来构建一个支持ROS接口的机械臂,负责制定机械臂的运动方案,

2024-10-17 10:27:00 191

原创 TensorFlow(1.15版本),tf.map_fn速度很慢

把tf.map_fn替换成tf.where实现。

2024-10-14 16:59:19 54

原创 Unity导入ml-agents的项目

在unity自己的界面里,不是unity hub的界面,点。文件夹里找,打开.unity文件。

2024-10-10 09:42:09 138

原创 Mac,pip3 install ./ml-agents,报错 Could not find cmake executable!

【代码】Mac,pip3 install ./ml-agents,报错 Could not find cmake executable!

2024-10-08 11:58:25 141

原创 思维链CoT / 检索增强生成RAG,来调用ChatGPT,有效的原因

prompt相当于模型的输入的特征。自己训练一个模型,也是希望特征在正确的前提下越多越好。在prompt本身正确的前提下,肯定是prompt输入越多,ChatGPT回复的越准,

2024-10-07 11:34:26 79

原创 【搜索算法】做query标签 vs 做item标签 for扩召回

做query理解/标签 容易出效果,query之前没有同义词 纠错词等标签,相当于从零做,或者优化之前的query标签,而item之前已有很准的“标签”也就是item名称分词的结果。

2024-10-06 22:33:46 124

原创 Mac,浏览器显示github上的图片

注意IP地址可能会变,根据域名查一下。

2024-09-27 22:18:16 118

原创 python 去掉图片中四边的白色/浅色

【代码】python 去掉图片周围的白色/浅色。

2024-09-22 22:34:15 241

原创 【搜索算法】以扩召回为目标,item-tag不如query-tag能扩更多数量

如果扩召回的逻辑是:query-tag等于item-tag时,输入query召回该item,那么每个query-tag可平均召回500个item,,(1-item --> 1tag --> 1500query),如果想给item挖掘tag打上,每个item要挖掘1500个tag之多!如果item类目体系一共20个类目,每个item都有一个类目,一共有10000个item,则平均每个类目tag下有500个item,,如果一共30000个query,那么。那么给每个query打上一个类目,

2024-09-16 08:12:20 312

原创 python 只保留图片中的深色

【代码】python 只保留图片中的深色。

2024-09-15 22:41:10 173

原创 hive sql, stringCol1 contains stringCol2

【代码】hive sql, stringColumn1 contains stringColumn2。

2024-09-14 19:53:50 170

原创 huggingface transformers 报错 ‘list‘ object has no attribute ‘size‘

已经是python list类型,

2024-09-06 16:21:57 107

原创 Python Flask 实现图片上传页面

【代码】python Flask 实现图片上传页面。

2024-09-06 09:25:05 655

原创 使用 torch.utils.data 的 DataLoader

【代码】使用 torch.utils.data 的 DataLoader。

2024-09-05 23:16:43 93

原创 PyTorch 使用多GPU(数据并行)

【代码】PyTorch 使用多GPU。

2024-09-03 10:12:23 139

原创 调用Blip2-T5实现image2text

【代码】调用Blip2-T5实现image2text。

2024-09-03 09:32:12 332

原创 训练BlipForConditionalGeneration

【代码】训练BlipForConditionalGeneration。

2024-09-01 20:12:41 224

原创 使用中文tokenizer和BlipForConditionalGeneration实现中文image caption

【代码】使用Blip的预训练好的imageEncoder并替换其decoder。

2024-09-01 19:54:28 192

原创 PyTorch改为默认使用GPU

PyTorch默认用CPU,改默认用GPU,

2024-09-01 19:51:05 492

原创 ElasticSearch索引和搜索词匹配的一些细节

一个item“麦当劳”:被切词成“麦当 + 劳”

2024-08-28 15:51:00 508

原创 【code2image】使用bokeh画图,去掉右侧的按钮

【代码】【code2image】使用bokeh画图,去掉右侧的按钮。

2024-08-26 21:59:31 168

原创 调用Blip image tokenizer实现image2text

【代码】调用Blip image tokenizer实现image2text。

2024-08-22 22:14:28 174

原创 VQ-VAE的 image tokenizer 的原理

VQ-VAE 里的 vector quatization。简单来说,就是要先有一个codebook,这个codebook是一个embedding table。我们在这个embedding table中找到和vector最接近(比如欧氏距离最近)的一个embedding,用这个embedding的index来代表这个vector,就实现了把一个vector表示成离散的token-id。可见这种image tokenizer的方式出来的token词典,肯定是只适用于训练时的图片数据集的。

2024-08-21 09:19:58 208

原创 【code2image】使用bokeh画图,读png并在图上加文本

【代码】【code2image】使用bokeh画图,读png并在图上加文本。

2024-08-17 23:34:09 148

原创 【code2image】使用bokeh画图,保存为png

【代码】【code2image】使用bokeh画图,保存为png。

2024-08-17 22:58:23 127

原创 【code2image】使用bokeh画图,把文本画在图上

【代码】【code2image】使用bokeh画图,把文本画在图上。

2024-08-17 22:43:12 113

原创 【code2image】使用bokeh画图,去掉背景

【代码】【code-draw】使用bokeh画图,去掉背景。

2024-08-16 23:55:48 165

原创 【推荐系统】精简特征的意义

前文 https://blog.csdn.net/guotong1988/article/details/140605537。有100个特征,如果线上每个特征出问题的几率是1%,那么100个特征都不出问题的概率就是0.99^100,有200个特征,如果线上每个特征出问题的几率是1%,那么200个特征都不出问题的概率就是0.99^200,比如原来10个特征,每个成功率99%,现在合并成1个特征,成功率也是99%,不就相当于提升了整体成功率。

2024-08-07 10:01:40 171

原创 Practice Lessons for AI Applications

Rule-based data cleaning is very important in rule-match and fuzzy-match algorithm.Everything is classification, so classification solves all. Also, everything is mapping to another dimension to be understand.What is mapping? Mapping solves all:text-mapTo

2024-08-05 21:35:28 86

原创 Three basic starting points to do AI

Computers have been based on memory/storage for so many years. Don’t try to come up with something else.For so many years, AI has been based on fixed precise rules or fuzzy matching rules. Don’t think about coming up with the third one by yourself.View dee

2024-08-01 09:58:47 278

原创 python 曲线拟合

【代码】python 曲线拟合。

2024-07-31 10:55:55 188

原创 GPT4 > 搜索引擎,如同 向量召回(做得好的话) > BM25文本召回

所以向量召回的结果起码会是BM25文本召回的补充。向量召回(做得好的话)的结果是。BM25文本召回的结果是。

2024-07-24 14:24:53 84

原创 多国语言的词根提取

下载libstemmer-java(https://download.csdn.net/download/guotong1988/89574039)解压,把整个目录放到IDE里。

2024-07-24 11:36:23 59

原创 Spark报错,Task not serializable

objectA调用了objectB里面的一个方法methodB。objectB也调了objectA里面的一个方法methodA。可能是有两个Object:objectA,objectB。

2024-07-23 15:02:59 93

原创 【推荐系统】特征一致性的困局

加更多特征,特征一致性问题越大,则线上效果不好靠加特征提升。特征越多,特征一致性有问题的特征越多,

2024-07-22 11:37:38 168

原创 【NLP】提升文本生成多样性的实用方法

可以每训练3个epoch保存一个模型参数,最终可保存5个模型参数,预测时5个模型结果分别 对同样的输入文本 各预测一次,如果只有几千条fine-tune数据,实测可提升50%的多样生成结果。

2024-07-22 11:09:37 297

原创 python,从n个不同元素中取出r个元素的所有不同组合

即 nCr,which represents “n choose r”

2024-07-22 09:30:11 130

原创 fastjson,toJSONString代码实例

【代码】fastjson,toJSONString代码实例。

2024-07-18 17:09:03 107

torch-1.13.1+cu117-cp38-cp38-linux-x86-64.whl

torch-1.13.1+cu117-cp38-cp38-linux-x86-64.whl

2024-12-20

torch-2.0.0+cu118-cp38-cp38-linux-x86-64.whl的zip-2/2

torch-2.0.0+cu118-cp38-cp38-linux-x86-64.whl的zip-2/2

2024-12-19

torch-2.0.0+cu118-cp38-cp38-linux-x86-64.whl的zip-1/2

torch-2.0.0+cu118-cp38-cp38-linux-x86-64.whl的zip-1/2

2024-12-19

联想笔记本,win10没声音,f1长亮

下载安装这个

2024-12-14

曹操传MOD禾下霸业 开源代码

学习游戏开发非常好的资料。 游戏视频:https://space.bilibili.com/447278957

2024-11-29

金庸群侠传MOD大侠梦 开源代码

学习游戏开发非常好的资料。 游戏视频:https://space.bilibili.com/447278957

2024-11-29

depth-anything/Depth-Anything-V2-Base-hf

https://huggingface.co/depth-anything/Depth-Anything-V2-Base-hf

2024-11-08

torchvision-0.19.1+cu118-cp38-cp38-linux-x86-64.whl

更多:https://download.pytorch.org/whl/torchvision

2024-10-29

torch-2.4.1+cu118-cp38-cp38-linux-x86-64.whl

更多:https://download.pytorch.org/whl/torch/

2024-10-28

torch-2.3.1+cu118-cp38-cp38-linux-x86-64.whl

更多:https://download.pytorch.org/whl/torch/

2024-10-28

torch-2.2.1+cu118-cp38-cp38-linux-x86-64.whl

更多:https://download.pytorch.org/whl/torch/

2024-10-25

huggingface.co/facebook/detr-resnet-50

https://huggingface.co/facebook/detr-resnet-50

2024-10-24

huggingface.co/Salesforce/blip-image-captioning-base

clone from https://huggingface.co/Salesforce/blip-image-captioning-base

2024-08-22

huggingface的bert-base-uncased.zip的split的2/2

huggingface的bert-base-uncased.zip的split的2/2

2024-08-21

huggingface的bert-base-uncased.zip的split的1/2

huggingface的bert-base-uncased.zip的split的1/2

2024-08-21

Qwen2-7B 的 model-00004-of-00004.safetensors 的2/2

Qwen2-7B 的 model-00004-of-00004.safetensors 的2/2

2024-07-29

Qwen2-7B 的 model-00004-of-00004.safetensors 的1/2

Qwen2-7B 的 model-00004-of-00004.safetensors 的1/2

2024-07-29

Qwen2-7B 的 model-00003-of-00004.safetensors 的2/2

Qwen2-7B 的 model-00003-of-00004.safetensors 的2/2

2024-07-29

Qwen2-7B 的 model-00003-of-00004.safetensors 的1/2

Qwen2-7B Base 的 model-00003-of-00004.safetensors 的1/2

2024-07-29

Qwen2-7B 的 model-00002-of-00004.safetensors 的2/2

Qwen2-7B 的 model-00002-of-00004.safetensors 的2/2

2024-07-28

Qwen2-7B 的 model-00002-of-00004.safetensors 的1/2

Qwen2-7B 的 model-00002-of-00004.safetensors 的1/2

2024-07-28

Qwen2-7B 的 model-00001-of-00004.safetensors 的2/2

Qwen2-7B 的 model-00001-of-00004.safetensors 的2/2

2024-07-28

Qwen2-7B 的 model-00001-of-00004.safetensors 的1/2

Qwen2-7B 的 model-00001-of-00004.safetensors 的1/2

2024-07-28

Qwen2-7B-Instruct 的 model-00004-of-00004.safetensors 的2/2

Qwen2-7B-Instruct 的 model-00004-of-00004.safetensors 的2/2

2024-07-26

Qwen2-7B-Instruct 的 model-00004-of-00004.safetensors 的1/2

Qwen2-7B-Instruct 的 model-00004-of-00004.safetensors 的1/2

2024-07-26

Qwen2-7B-Instruct 的 model-00003-of-00004.safetensors 的2/2

Qwen2-7B-Instruct 的 model-00003-of-00004.safetensors 的2/2

2024-07-26

Qwen2-7B-Instruct 的 model-00003-of-00004.safetensors 的1/2

Qwen2-7B-Instruct 的 model-00003-of-00004.safetensors 的1/2

2024-07-26

Qwen2-7B-Instruct 的 model-00002-of-00004.safetensors 的2/2

Qwen2-7B-Instruct 的 model-00002-of-00004.safetensors 的2/2

2024-07-26

Qwen2-7B-Instruct 的 model-00002-of-00004.safetensors 的1/2

Qwen2-7B-Instruct 的 model-00002-of-00004.safetensors 的1/2

2024-07-26

Qwen2-7B-Instruct 的 model-00001-of-00004.safetensors 的2/2

Qwen2-7B-Instruct 的 model-00001-of-00004.safetensors 的2/2

2024-07-25

Qwen2-7B-Instruct 的 model-00001-of-00004.safetensors 的1/2

Qwen2-7B-Instruct 的 model-00001-of-00004.safetensors 的1/2

2024-07-25

libstemmer-java-2.2.0.tar.gz

多国语言的词根提取

2024-07-24

torch-2.3.0+cu118-cp38-cp38-linux-x86-64.whl

pip3 install torch-2.3.0+cu118-cp38-cp38-linux_x86_64.whl 更多:https://download.pytorch.org/whl/torch/

2024-06-24

meta-llama-3-8b-instruct 的 model-00004-of-00004.safetensors

meta-llama-3-8b-instruct 的 model-00004-of-00004.safetensors

2024-05-29

meta-llama-3-8b-instruct 的 model-00003-of-00004.safetensors 的3/3

meta-llama-3-8b-instruct 的 model-00003-of-00004.safetensors 的3/3

2024-05-29

meta-llama-3-8b-instruct 的 model-00003-of-00004.safetensors 的2/3

meta-llama-3-8b-instruct 的 model-00003-of-00004.safetensors 的2/3

2024-05-29

meta-llama-3-8b-instruct 的 model-00003-of-00004.safetensors 的1/3

meta-llama-3-8b-instruct 的 model-00003-of-00004.safetensors 的1/3

2024-05-29

meta-llama-3-8b-instruct 的 model-00002-of-00004.safetensors 的3/3

meta-llama-3-8b-instruct 的 model-00002-of-00004.safetensors 的3/3

2024-05-29

meta-llama-3-8b-instruct 的 model-00002-of-00004.safetensors 的2/3

meta-llama-3-8b-instruct 的 model-00002-of-00004.safetensors 的2/3

2024-05-29

meta-llama-3-8b-instruct 的 model-00002-of-00004.safetensors 的1/3

meta-llama-3-8b-instruct 的 model-00002-of-00004.safetensors 的1/3

2024-05-29

自动驾驶,如何得到方向盘转动的ground truth?

2024-03-18

AlphaGo能超越人类,因为训练时 对于模型的每个输入,都有一个100%正确的答案?

2024-01-16

其实LLM/ChatGPT是否在距离AlphaGo式AI越来越远?

2024-01-16

技术上,ChatGPT要成为 AI医生/AI律师/AI教师 还欠缺哪些能力?

2024-01-11

数学 是且仅是 一种语言和一种工具,不是科学的全部?

2023-12-14

哪些时候用CUDA编程更好?

2023-12-14

MetaLearning是LearnToLearn,那如何解决LearnToLearnToLearn?

2022-05-24

BERT/GPT是 精确存储了所有每句话的“语义” 还是得出每句话的少数服从多数的统计“语义”?

2022-05-09

用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?

2022-05-07

没有物理机器人载体,如何在模拟环境里的进行学习和研究机器人?

2022-04-28

2022年了,USB式GPU有哪些进展?

2022-04-28

2022年了,有哪些稳压deepfm的CTR模型?

2022-04-01

CTR模型,如果上线了没效果,这时可以进行哪些分析工作?以及有无必要投入大量时间分析?

2022-03-24

算法工程师如何应对做算法策略的不确定性;比如没效果,这时绩效怎么保证?

2022-03-01

CTR模型必须要有一个测试数据集吗? 训练数据集和测试数据集是同一个,可以吗?

2022-02-25

有人搞过离线CTR模型么,缓存每个user对每个item的打分,没缓存的item默认处理,靠谱吗?

2022-02-18

把user买过的item的名字embedding后作为特征,以及item本身的名字embedding作为特征,这两个特征加到CTR模型,会有效果吧?

2022-02-16

为啥我感觉现在机器学习模型就是一种模糊匹配工具or相似识别工具?

2022-02-16

因果推断技术靠谱吗,感觉里面的影响因素太多了,所以能实际解决落地问题吗?

2022-02-08

XGB/GBDT/决策树,得出特征重要性的原理是什么?

2022-02-08

强化学习是不是无人驾驶的未来?

2022-02-01

GAN生成图像,弄一个discriminator ,和无D直接生成,区别是?

2022-02-01

哪些互联网公司的管理职级和专业职级是分开的?

2022-01-22

CTR模型的AUC如果比较高,是否其实只是 因为复购行为带来的AUC虚高?

2022-01-17

CTR模型的本质是不是算出 user的哪些特征和item的哪些特征 最匹配?

2022-01-08

人工智能的因果学习(Causal Learning)到底想解决什么问题?

2021-12-17

BYOL里stop-gradient的作用是什么?

2021-12-01

马上2022年了,强化学习+NLP 有了哪些突破?

2021-11-26

马上2022年了,pointer-network现在看来的作用是什么?

2021-11-26

总被主管说文档写的不好怎么办?

2021-11-18

NER任务只有一个类的情况下,BME或者Yes-No的数据预处理方式对结果有影响吗?

2021-11-08

为什么机器翻译文本生成,至今仍然在用transformer-auto-regressive的别扭架构?

2021-11-08

Float特征直接输入deepCTR模型和分桶转成int再embedding输入的区别是?

2021-11-08

学好数学对于编程的真实增益的性价比到底如何?

2021-11-03

学好数学对于编程的真实增益到底是多少?

2021-11-03

如果说每一个数学公式都在描述一件事情,那么数学公式的推导,是在做什么?

2021-10-26

研究出 通用人工智能/曲率引擎/黎曼猜想/可控核聚变/零事故飞行汽车/量子计算机/治愈癌症 的难度排名?

2021-10-20

每个物理公式是否都是在【描述】一个事情?

2021-10-12

求通俗讲讲数学或理论物理进行研究的细节,复杂公式是不是也都是由基础公式而来?

2021-09-14

基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度?

2021-08-17

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除