风可。-CSDN博客

看山是山，看水是水看山不是山，看水不是水看山还是山，看水看是水第一重境界，刚了解算法是什么，知道哪个模型可以用在哪个任务上。第二重境界，学会了不同模型之间的迁移使用，知道一个模型不仅仅用在一个任务上，而是可以相互迁移，比如分割模型也可以用在关键点检测上。第三重境界，理解了各个算法的本质，而不止停留在各种连接或结构上面，看到一个模型的时候可以看到模型的最细微的结构，所有的模型在眼中只是一个个最本质的东西而已。模型和模型之间已经没有了差别。就好像各个物质都是原子组成的结构而已，了解了原子的性质，.

2022-03-26 13:26:24 622

原创推荐算法随笔

推荐系统1年工作感想。意识流，想到什么写什么。由于机缘巧合从机器视觉转推荐算法已经满打满算一年了，从21年开始做的推荐系统，也1年没写过博客记录学习进程了，可以发现之前做CV的时候比做推荐还是要闲一些的，还有空看看一些论文，但也侧面体验出几个方面：做CV的论文是真的多，尤其是前几年各种牛逼的论文层出不穷；cv是追求精度，需要模型网络上的技巧；推荐系统是个工程和业务问题，更侧重于业务导向，并且上一个模型需要大量的工程上的依赖。换方向的还有个原因就是图像太卷了，换个领域卷一下。推荐系统的模型比起

2022-03-24 23:42:37 315

原创 deepWalk,GCN,graphSAGE,EGES,transformer各种方法异同点

deepWalk,GCN,graphSAGE,EGES,transformer各种图相关方法异同点1 deepWalk2 GCN3 graphSAGE4 EGES5 transformer20220324夜。知识点串一串，形成方法论，理解算法本质。此处仅举例了图或序列相关的算法。1 deepWalkrandomWalk + word2vec2 GCN领域矩阵+embedding矩阵+权重矩阵3 graphSAGErandomWalk采样+层次聚合+f+负采样，最终loss根据任务来设计。4

2022-03-24 23:25:16 1807

原创 (重要) tensorflow 2.0 functional API

https://tensorflow.google.cn/guide/keras/functional?hl=zh_cn1. 使用 functional API 流程1. 创建输入节点img_inputs = keras.Input(shape=(32, 32, 3))数据的形状设置为 784 维向量。由于仅指定了每个样本的形状，因此始终忽略批次大小（batch size）。2. 创建层x = layers.Dense(64, activation="relu")(inputs)x = la

2021-04-27 16:59:53 600

原创 go语言程序的例子，可以对着敲

每一节都是代码，没过多的解释，可以熟悉一下代码链接：https://www.yiibai.com/go/hello-world.html

2021-04-24 20:01:56 151

原创 [NLP] Doc2Vec

Doc2Vec Model1 Review: Bag-of-words此模型将每个文档转换为固定长度的整数向量。例如，给定句子：John likes to watch movies. Mary likes movies too.John also likes to watch football games. Mary hates football.模型输出向量：[1, 2, 1, 1, 2, 1, 1, 0, 0, 0, 0][1, 1, 1, 1, 0, 1, 0, 1, 2, 1,

2021-03-02 17:04:10 253

原创 spark里rdd操作才是精髓

rdd！

2021-02-26 12:34:04 178

原创 PySpark withColumn更新或添加列

原文：https://sparkbyexamples.com/pyspark/pyspark-withcolumn/PySparkwithColumn()是DataFrame的转换函数，用于更改或更新值，转换现有DataFrame列的数据类型，添加/创建新列以及多核。在本文中，我将使用withColumn（）示例向您介绍常用的PySpark DataFrame列操作。PySpark withColumn –更改列的数据类型转换/更改现有列的值从现有列派生新列添加具有文字值的列重命名列名删除D

2021-02-09 14:26:17 19636

原创 spark基础4

机器学习库MLlib、SparseVector、dense vector、labelpoint机器学习库MLlib、SparseVector、dense vector、labelpoint什么是“ Spark ML”？功能简介版本差异说明：*为什么MLlib切换到基于DataFrame的API？*数据类型 - RDD-based API局部向量scala：python：记录label数据，Labeled pointlibsvm格式机器学习库MLlib、SparseVector、dense vector、l

2021-02-04 14:52:10 256

原创 spark基础3

通用的文件读取方式、spark转pandas通用的文件读取方式、spark转pandaspyspark：scala：例子：保存模型分桶、分区、Bucketing, Sorting and PartitioningPySpark Usage Guide for Pandas with Apache Arrowhttp://spark.apache.org/docs/2.4.3/sql-pyspark-pandas-with-arrow.html什么是分桶？和分区有什么区别？通用的文件读取方式、spark转p

2021-02-04 13:45:35 274

原创 spark基础2

rdd、dataframe、读取parquetrdd和dataframe的区别spark sqldataframesparkSession访问字段执行sql语句datasets,rdd转换为dataframe读写parquet分区读hivesqlDF.rdd.maprdd和dataframe的区别http://spark.apache.org/docs/2.4.3/sql-getting-started.html其实spark教程最开始就介绍了rdd，说rdd有转换和行为两种，也就是有map，fi

2021-02-04 13:44:27 170

空空如也

空空如也