- 博客(7)
- 收藏
- 关注
原创 MapReduce阶段划分
MapReduce执行的4个阶段,分别为Split阶段—> Map阶段 —> Shuffle阶段 —> Reduce阶段。
2023-07-08 21:50:09 791
原创 宽依赖与窄依赖
窄依赖指的是每一个父RDD的Partition最多被子RDD的一个Partition使用。宽依赖指的是多个子RDD的Partition会依赖同一个父RDD的Partition,。
2023-07-08 14:35:38 481
原创 词向量模型Word2vec原理
1、Word2vec简介词向量将自然语言转换成了计算机能够理解的向量。相对于词袋模型、TF-IDF等模型,词向量能抓住词的上下文、语义,衡量词与词的相似性,在文本分类、情感分析等许多自然语言处理领域有重要作用。2、Word2vec详细实现word2vec的详细实现,简而言之,就是一个三层的神经网络:假设,词库里的词数为10000,词向量的长度为300。1、输入层:输入为一个词的one-...
2020-03-19 22:38:38 1442
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人