机器学习
文章平均质量分 87
薇酱
=。=
展开
-
半监督短语挖掘:autophrase是什么?
半监督短语挖掘方式autophrase介绍原创 2022-12-03 15:48:35 · 1381 阅读 · 1 评论 -
什么是Transformer
目录Encoder:Decoder:Decoder-Autoregressivemulti-head attention VSmasked multi-head attentionDecoder-Non-AutoregressiveEncoder和Decoder联合工作Training:训练技巧优化评估指标推荐阅读:整体结构Transformer是一个Sequence to Sequence的模型,主要的结构是encoder和decoder...原创 2021-10-25 09:30:00 · 1908 阅读 · 0 评论 -
FastText-PVDM,Distributed Representations of Sentences and
https://github.com/aiweiw/fasttext-PVDM原创 2021-05-30 23:49:48 · 226 阅读 · 0 评论 -
FastText使用指南
官方使用指南:https://fasttext.cc/docs/en/unsupervised-tutorial.html除了word2vec之外,fastText是谷歌开源的另一款计算词向量的工具。性能比肩深度网络且训练速度更快,处理计算词向量之外,它还支持文本分类,引入了子词(subword)概念,对训练样本中未见过的词也能有很好的预测结果。(对于英文来说,前缀或者是后缀相同的词往往有着相近的意思,对于中文lai'sh)一.文本分类训练: ./fasttext supervised -inp原创 2021-05-23 18:49:11 · 795 阅读 · 2 评论 -
Word2vec原理+常见优化手段
官网地址:https://code.google.com/archive/p/word2vec/我觉得原理讲的比较好的:https://www.cnblogs.com/pinard/p/7160330.html最近发现学习知识还是尽量找官网的解释,比较全,别人讲过的会帮助你理解,但是会漏掉一些知识word2vec是训练词向量的一款非常好用的工具,由谷歌发明,主要有:1.2种模型: cbow(连续词袋模型)和skip-gram(跳字模型)2.2种近似训练的方法:层次softmax和naga原创 2021-05-23 18:31:10 · 1550 阅读 · 0 评论 -
WSDM2020_HUP 层次结构的用户画像学习笔记
新版用户画像:层次结构的用户画像HUP1.微行为(其中还包括来源,比如搜索、主页等等)2.Time-LSTM 用来追踪用户的兴趣漂移的情况3.Pyramid Recurrent Neural Networksmicro layer, an itemlayer, and multiple category recurrent neural network layersBehavior-LSTMwhere a behavior gate isdesigned to model the typ原创 2020-09-28 17:37:58 · 208 阅读 · 0 评论 -
NLP自然语言处理1---使用正则表达式
1.析取使用括号,匹配括号里的任意字符[abc]dee],即匹配 adee,bdee,cdee[Ww]ood,即匹配 Wood和wood使用范围:[a-z] 表示匹配小写字母[A-Z] 表示匹配大写字母2.非析取[^Ss][^A-Z]非大写字母,即匹配小写字母或其他字符。3.更多析取more|less,匹配more或者是lessa|b|c,即[a...原创 2019-05-04 14:29:05 · 1233 阅读 · 0 评论 -
当机器学习性能遭遇瓶颈时,如何优化?
原文:https://machinelearningmastery.com/machine-learning-performance-improvement-cheat-sheet/从一个公众号上看来的,尝试精简翻译一下 从以下4个方面着手:1.数据2.算法3.算法调忧4.集成 这4个方面对于性能提升的效果一般来讲是逐级递减的。 一、数据1)获...翻译 2019-01-25 18:20:13 · 815 阅读 · 0 评论 -
mac TensorFlow升级问题总结
1.安装TensorFlow:直接sudo pip install tensorflow 即可安装TensorFlow,但是直接用pip安装的TensorFlow版本太低,所以我需要更新一下。遇到的问题:1.更新时报错遇到无法卸载 numpy 1.8.0rc1,sudo pip install tensorflow --ignore-installed six2.更新结束之后,发现版本并没有产生变...原创 2018-02-13 15:45:29 · 1025 阅读 · 0 评论 -
【机器学习】决策树
一、决策树是什么呢? 举个例子: 小明来找你出去玩耍,你想不想去呢? 1)不想–结果:不去 2)想–作业没做完–结果:不去 3)想–作业做完了–结果:去 以图形化的方式呈现,就如下图所示 这就是一个决策树: 每个节点根据一个条件划分,每个分叉代表着该条件下的值,每个叶子代表一个结论。 更为一般的: 每个节点根据一个属性划分,每个分叉代表一个值,每个叶子代表一个分类。原创 2015-06-15 15:51:39 · 394 阅读 · 0 评论 -
【机器学习】knn(k-近邻算法)&numpy安装
照着机器学习实战这本书来学习机器学习的,自己写下点学习的收获。0.安装numpy1.knn算法简介原创 2015-05-29 17:32:39 · 1261 阅读 · 0 评论