自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 tensorflow.feature_column

1. 数值列:tf.feature_column.numeric_column用于dense特征,可指定该特征的数值类型为float64等(默认为float64),也可指定该特征是一个10维向量或矩阵。# Represent a tf.float64 scalar.numeric_feature_column = tf.feature_column.numeric_column(key="SepalLength",dtype=tf.float64)# Represent a 10-elem

2020-11-10 17:55:27 218

原创 神经网络中常用的激活函数

为什么要用激活函数: 引入非线性。1. SIGMODSigmoid导数:缺点:容易发生梯度消失。当z特别大或者特别小的时候,从图像可以看出,导数的梯度或者函数的斜率会特别小,最后会接近0,梯度下降的速度降低。如果我们初始化神经网络的权值为[ 0 , 1 ]之间的随机值,由反向传播算法的数学推导可知,梯度从后向前传播时,每传递一层梯度值都会减小为原来的0.25倍,如果神经网络隐层特别多,那么梯度在穿过多层后将变得非常小接近于0,即出现梯度消失现象;当网络权值初始化为( 1 , + ..

2020-10-15 20:15:52 302

原创 梯度的方向

要明确梯度是一个向量,是一个n元函数f关于n个变量的偏导数,比如三元函数f的梯度为(fx,fy,fz),二元函数f的梯度为(fx,fy),一元函数f的梯度为fx。然后要明白梯度的方向是函数f增长最快的方向,梯度的反方向是f降低最快的方向。那么,为什么梯度的方向为什么是函数值增加最快的方向?参考:https://zhuanlan.zhihu.com/p/38525412...

2020-10-14 17:51:06 6447

原创 FM、deepFM介绍以及特征处理

FM FM在LR的基础上引入交叉项,其公式为:从公式中可以看出,组合特征的参数一共有1+2+….+(n-1) =n(n−1)/2 个,n是离散化后的特征维度。Wij求解的思路是通过矩阵分解的方法。所有的二次项参数Wij可以组成一个对称阵W,W可以分解为 W=VTV,V 的第 i 列便是第 i 维特征的隐向量,如下。FM模型的复杂度是线性的,FM模型是SVM模型与factorization模型的结合。公式推导、求导参数更新、以及FM相比较SVM的优点和不同参考:https:/..

2020-10-13 17:43:41 4310

原创 论文阅读: App2Vec: Vector Modeling of Mobile Apps and Applications

论文数据来源:雅虎 数据量:300 million iOS users from one day in February 2015。三亿用户一天APP的使用情况~~ 生成APP vector之间评估相似的方法: 余弦相似度。 准确性评估标准: 人工审查。定义了strong relevant、relevant、not relevant三个级别。比较方法:BoW(Bag-of-word...

2020-10-13 16:13:53 968

原创 keras模型加载 Unknown Layer

存储模型train.py: model.save('model_weight.h5')在predict.py中,使用model = load_model("model_weight.h5")对模型进行加载的时报错信息:Unknown Layer:LayerName。此处的LayerName代指自定义的layer。 global name 'tf' is not defined正...

2020-04-02 16:39:36 1584

原创 pandas对每列数据(离散特征)进行编码

PATH_TO_DATA = 'XXX'data = pd.read_csv(PATH_TO_DATA, sep='\t', header=None)data.columns = ['UId', 'ItemId', 'BrandId', 'MiddlesortId', 'ClickTime', 'Date']data = data[['UId', 'ItemId', 'BrandId', '...

2020-03-18 12:42:52 1388 1

原创 test

#!/usr/bin/env python# -*- coding: utf-8 -*-"""@Time : 2018/4/23 10:58@Author : Junya Lu@Site : """import numpy as npimport timeimport tensorflow as tffrom tensorflow.python.layers.co...

2018-05-03 15:44:08 277

原创 TensorFlow实现自编码器

#!/usr/bin/env python# -*- coding: utf-8 -*-"""@Time : 2018/4/27 15:29@Author : Junya Lu@Site : """import tensorflow as tfimport numpy as npimport sklearn.preprocessing as prepfrom te...

2018-04-28 11:19:57 172

原创 TensorFlow入门代码--识别手写数字

#!/usr/bin/env python# -*- coding: utf-8 -*-"""@Time : 2018/4/28 11:22@Author : Junya Lu@Site : 多层感知机识别数字"""from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow a...

2018-04-27 15:09:27 511

原创 Python Networkx 包常用的方法函数

找子节点: DiGraph.successors(n) Return a list of successor nodes of n. 找父节点:DiGraph.predecessors(n) Return a list of predecessor nodes of n. 求距离某一节点(0)的最短路径: nx.shortest_path_length(G, 0, node)

2017-12-10 19:51:48 3271 1

原创 python 统计list中各个元素出现的次数

python 统计list中各个元素出现的次数利用Python字典统计利用Python的collection包下Counter的类统计利用Python的pandas包下的value_counts的类统计利用字典dict来完成统计举例:a = [1, 2, 3, 1, 1, 2]dict = {}for key in a: dict[key] = dict.get(key, 0)

2017-09-10 21:04:43 178663 11

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除