- 博客(19)
- 资源 (385)
- 问答 (103)
- 收藏
- 关注
原创 TfidfTransformer 输出
from sklearn.feature_extraction.text import TfidfTransformerfrom sklearn.feature_extraction.text import CountVectorizerimport jsoncorpus = []f = open("data/msmarco/collection.tsv",mode="r",encodi...
2019-07-30 14:33:17 2044
原创 tfidf python 中文 实例
from sklearn.feature_extraction.text import TfidfTransformerfrom sklearn.feature_extraction.text import CountVectorizerif __name__ == "__main__": corpus = ["我 来到 北京 清华大学", # 第一个文本切词后的结果,词之间以空格...
2019-07-25 10:19:37 2682
原创 词向量 工程化 多线程 节省内存
如果有N个模型实例在内存,就要有N份词向量在内存,解决方法:在模型外面维护1个词向量库,只传该输入模型的那几个句子的每个词的词向量进去,模型内部不用embedding_lookup接口,...
2019-07-19 11:32:50 225 1
原创 python BM25
安装pip install rank-bm25from rank_bm25 import BM25Okapicorpus = [ "Hello there good man!", "It is quite windy in London", "How is the weather today?"]tokenized_corpus = [doc.split(" ...
2019-07-18 10:33:28 1640
原创 python B树
安装pip install BTreesfrom BTrees.OOBTree import OOBTreet = OOBTree()t.update({1: "red", 2: "green", 3: "blue", 4: "spades"})可见BTree数据的输入格式
2019-07-18 09:52:39 1010 1
原创 一个向量 和 一组向量 的attention计算,mxnet实现
user_input = mx.sym.reshape(user_input_before_reshape, shape=(-1, total_group_length, eb_dim))att_user_input = mx.sym.reshape(user_input, (bs, total_group_length, eb_dim))att_node_input = mx.sym.res...
2019-07-10 11:50:17 524
原创 python list 完全相等的坑:元素顺序不同判定为不相等
list1 = ["one","two","three"]list2 = ["one","two","three"]print(list1 == list2) # Truelist1 = ["one","three","two"]list2 = ["one","two","three"]print(list1 == list2) # False 解决办法list1 = ["one"...
2019-07-09 17:35:10 17500 5
原创 python list contains 判断列表是否包含另一列表
判断列表是否包含另一列表list1 = ["one","two","three"]list2 = ["one","three","two","four"]set(list1).issubset(set(list2))set(list2).issuperset(set(list1))
2019-07-09 17:31:25 6592
原创 OpenNMT做端对端的接口使用
安装:其中requirements.txt里安装的是很新的torchtextgit clone --branch 0.9.1 https://github.com/OpenNMT/OpenNMT-py.gitcd OpenNMT-pypip install -r requirements.txt cd ..预处理:其中src-train.txt和tgt-train.txt为原始英文...
2019-07-09 15:16:29 1319 8
原创 TDM阅读笔记,在推荐系统的应用
《Learning Tree-based Deep Model for Recommender Systems》问题•每个商品的 向量表示/embedding 随机初始化。•每个用户的历史信息的 向量表示/embedding 随机初始化。•我们输入深度模型这两个embedding,输出他们关联程度的得分。•也就是如果我们要得到 一个用户对所有商品 的每个得分,然后排序,取出得分最高几个。...
2019-07-08 16:00:33 1247
原创 linux上maven报错:The JAVA_HOME environment variable is not defined correctly
看下mvn的源码,设置$JAVA_HOME/bin/下有java文件且检查一下可执行权限
2019-07-05 16:35:43 3739
原创 MS MARCO数据集,Passage Ranking数据格式说明
摘自https://github.com/microsoft/MSMARCO-Passage-Ranking
2019-07-05 14:50:33 4540
原创 文本聚类 baseline 实例
from sklearn.cluster import KMeansimport numpy as np# hidden_dim = 2X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])kmeans = KMeans(n_clusters=2, random_state=0).fit...
2019-07-05 09:56:57 769
原创 transformer里的attention mask产生的 单向双向效果和xlnet里的效果
1,2,3,4是一句话的四个词,并打乱了顺序,以xlnet为例,图中,上图和下图的区别是下图扣去邪线,上图表示,1可以看到1,2可以看到2,3可以看到3,4可以看到4,下图表示,1不能看到1,2不能看到2,3不能看到3,4不能看到4,把这个mask矩阵左下角全部置0,则是单向transformer,把整个mask矩阵全部置1,则是双向transformer,回到上图,矩阵第一行...
2019-07-03 11:52:02 5261 3
原创 Document Expansion by Query Prediction 划重点
用doc_train和query_train训练一个生成式model,doc_test过来用model生成query_test_v2,再把doc_test和query_test_v2拼起来作为doc_test_v2,还用query_test查
2019-07-03 09:50:49 554
原创 python 不保留float最后的0
https://stackoverflow.com/questions/2440692/formatting-floats-in-python-without-trailing-zeros注意会把类型变成str或Decimal
2019-07-02 14:50:26 6910
huggingface.co/Salesforce/blip-image-captioning-base
2024-08-22
Qwen2-7B 的 model-00004-of-00004.safetensors 的2/2
2024-07-29
Qwen2-7B 的 model-00004-of-00004.safetensors 的1/2
2024-07-29
Qwen2-7B 的 model-00003-of-00004.safetensors 的2/2
2024-07-29
Qwen2-7B 的 model-00003-of-00004.safetensors 的1/2
2024-07-29
Qwen2-7B 的 model-00002-of-00004.safetensors 的2/2
2024-07-28
Qwen2-7B 的 model-00002-of-00004.safetensors 的1/2
2024-07-28
Qwen2-7B 的 model-00001-of-00004.safetensors 的2/2
2024-07-28
Qwen2-7B 的 model-00001-of-00004.safetensors 的1/2
2024-07-28
Qwen2-7B-Instruct 的 model-00004-of-00004.safetensors 的2/2
2024-07-26
Qwen2-7B-Instruct 的 model-00004-of-00004.safetensors 的1/2
2024-07-26
Qwen2-7B-Instruct 的 model-00003-of-00004.safetensors 的2/2
2024-07-26
Qwen2-7B-Instruct 的 model-00003-of-00004.safetensors 的1/2
2024-07-26
Qwen2-7B-Instruct 的 model-00002-of-00004.safetensors 的2/2
2024-07-26
Qwen2-7B-Instruct 的 model-00002-of-00004.safetensors 的1/2
2024-07-26
Qwen2-7B-Instruct 的 model-00001-of-00004.safetensors 的2/2
2024-07-25
Qwen2-7B-Instruct 的 model-00001-of-00004.safetensors 的1/2
2024-07-25
torch-2.3.0+cu118-cp38-cp38-linux-x86-64.whl
2024-06-24
meta-llama-3-8b-instruct 的 model-00004-of-00004.safetensors
2024-05-29
meta-llama-3-8b-instruct 的 model-00003-of-00004.safetensors 的3/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00003-of-00004.safetensors 的2/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00003-of-00004.safetensors 的1/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00002-of-00004.safetensors 的3/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00002-of-00004.safetensors 的2/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00002-of-00004.safetensors 的1/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00001-of-00004.safetensors 的3/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00001-of-00004.safetensors 的2/3
2024-05-29
meta-llama-3-8b-instruct 的 model-00001-of-00004.safetensors 的1/3
2024-05-29
huggingface的bert-base-chinese
2024-03-05
huggingface的bert-base-uncased
2024-03-03
自动驾驶,如何得到方向盘转动的ground truth?
2024-03-18
AlphaGo能超越人类,因为训练时 对于模型的每个输入,都有一个100%正确的答案?
2024-01-16
其实LLM/ChatGPT是否在距离AlphaGo式AI越来越远?
2024-01-16
技术上,ChatGPT要成为 AI医生/AI律师/AI教师 还欠缺哪些能力?
2024-01-11
数学 是且仅是 一种语言和一种工具,不是科学的全部?
2023-12-14
哪些时候用CUDA编程更好?
2023-12-14
用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?
2022-05-07
没有物理机器人载体,如何在模拟环境里的进行学习和研究机器人?
2022-04-28
2022年了,USB式GPU有哪些进展?
2022-04-28
2022年了,有哪些稳压deepfm的CTR模型?
2022-04-01
CTR模型,如果上线了没效果,这时可以进行哪些分析工作?以及有无必要投入大量时间分析?
2022-03-24
算法工程师如何应对做算法策略的不确定性;比如没效果,这时绩效怎么保证?
2022-03-01
CTR模型必须要有一个测试数据集吗? 训练数据集和测试数据集是同一个,可以吗?
2022-02-25
为啥我感觉现在机器学习模型就是一种模糊匹配工具or相似识别工具?
2022-02-16
因果推断技术靠谱吗,感觉里面的影响因素太多了,所以能实际解决落地问题吗?
2022-02-08
XGB/GBDT/决策树,得出特征重要性的原理是什么?
2022-02-08
强化学习是不是无人驾驶的未来?
2022-02-01
GAN生成图像,弄一个discriminator ,和无D直接生成,区别是?
2022-02-01
哪些互联网公司的管理职级和专业职级是分开的?
2022-01-22
CTR模型的AUC如果比较高,是否其实只是 因为复购行为带来的AUC虚高?
2022-01-17
CTR模型的本质是不是算出 user的哪些特征和item的哪些特征 最匹配?
2022-01-08
人工智能的因果学习(Causal Learning)到底想解决什么问题?
2021-12-17
BYOL里stop-gradient的作用是什么?
2021-12-01
马上2022年了,强化学习+NLP 有了哪些突破?
2021-11-26
马上2022年了,pointer-network现在看来的作用是什么?
2021-11-26
总被主管说文档写的不好怎么办?
2021-11-18
NER任务只有一个类的情况下,BME或者Yes-No的数据预处理方式对结果有影响吗?
2021-11-08
学好数学对于编程的真实增益的性价比到底如何?
2021-11-03
学好数学对于编程的真实增益到底是多少?
2021-11-03
如果说每一个数学公式都在描述一件事情,那么数学公式的推导,是在做什么?
2021-10-26
每个物理公式是否都是在【描述】一个事情?
2021-10-12
求通俗讲讲数学或理论物理进行研究的细节,复杂公式是不是也都是由基础公式而来?
2021-09-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人