- 博客(12)
- 收藏
- 关注
原创 tensorflow.feature_column
1. 数值列:tf.feature_column.numeric_column用于dense特征,可指定该特征的数值类型为float64等(默认为float64),也可指定该特征是一个10维向量或矩阵。# Represent a tf.float64 scalar.numeric_feature_column = tf.feature_column.numeric_column(key="SepalLength",dtype=tf.float64)# Represent a 10-elem
2020-11-10 17:55:27 302
原创 神经网络中常用的激活函数
为什么要用激活函数: 引入非线性。1. SIGMODSigmoid导数:缺点:容易发生梯度消失。当z特别大或者特别小的时候,从图像可以看出,导数的梯度或者函数的斜率会特别小,最后会接近0,梯度下降的速度降低。如果我们初始化神经网络的权值为[ 0 , 1 ]之间的随机值,由反向传播算法的数学推导可知,梯度从后向前传播时,每传递一层梯度值都会减小为原来的0.25倍,如果神经网络隐层特别多,那么梯度在穿过多层后将变得非常小接近于0,即出现梯度消失现象;当网络权值初始化为( 1 , + ..
2020-10-15 20:15:52 326
原创 梯度的方向
要明确梯度是一个向量,是一个n元函数f关于n个变量的偏导数,比如三元函数f的梯度为(fx,fy,fz),二元函数f的梯度为(fx,fy),一元函数f的梯度为fx。然后要明白梯度的方向是函数f增长最快的方向,梯度的反方向是f降低最快的方向。那么,为什么梯度的方向为什么是函数值增加最快的方向?参考:https://zhuanlan.zhihu.com/p/38525412...
2020-10-14 17:51:06 6673
原创 FM、deepFM介绍以及特征处理
FM FM在LR的基础上引入交叉项,其公式为:从公式中可以看出,组合特征的参数一共有1+2+….+(n-1) =n(n−1)/2 个,n是离散化后的特征维度。Wij求解的思路是通过矩阵分解的方法。所有的二次项参数Wij可以组成一个对称阵W,W可以分解为 W=VTV,V 的第 i 列便是第 i 维特征的隐向量,如下。FM模型的复杂度是线性的,FM模型是SVM模型与factorization模型的结合。公式推导、求导参数更新、以及FM相比较SVM的优点和不同参考:https:/..
2020-10-13 17:43:41 4499
原创 论文阅读: App2Vec: Vector Modeling of Mobile Apps and Applications
论文数据来源:雅虎 数据量:300 million iOS users from one day in February 2015。三亿用户一天APP的使用情况~~ 生成APP vector之间评估相似的方法: 余弦相似度。 准确性评估标准: 人工审查。定义了strong relevant、relevant、not relevant三个级别。比较方法:BoW(Bag-of-word...
2020-10-13 16:13:53 1038
原创 keras模型加载 Unknown Layer
存储模型train.py: model.save('model_weight.h5')在predict.py中,使用model = load_model("model_weight.h5")对模型进行加载的时报错信息:Unknown Layer:LayerName。此处的LayerName代指自定义的layer。 global name 'tf' is not defined正...
2020-04-02 16:39:36 1626
原创 pandas对每列数据(离散特征)进行编码
PATH_TO_DATA = 'XXX'data = pd.read_csv(PATH_TO_DATA, sep='\t', header=None)data.columns = ['UId', 'ItemId', 'BrandId', 'MiddlesortId', 'ClickTime', 'Date']data = data[['UId', 'ItemId', 'BrandId', '...
2020-03-18 12:42:52 1437 1
原创 test
#!/usr/bin/env python# -*- coding: utf-8 -*-"""@Time : 2018/4/23 10:58@Author : Junya Lu@Site : """import numpy as npimport timeimport tensorflow as tffrom tensorflow.python.layers.co...
2018-05-03 15:44:08 291
原创 TensorFlow实现自编码器
#!/usr/bin/env python# -*- coding: utf-8 -*-"""@Time : 2018/4/27 15:29@Author : Junya Lu@Site : """import tensorflow as tfimport numpy as npimport sklearn.preprocessing as prepfrom te...
2018-04-28 11:19:57 187
原创 TensorFlow入门代码--识别手写数字
#!/usr/bin/env python# -*- coding: utf-8 -*-"""@Time : 2018/4/28 11:22@Author : Junya Lu@Site : 多层感知机识别数字"""from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow a...
2018-04-27 15:09:27 523
原创 Python Networkx 包常用的方法函数
找子节点: DiGraph.successors(n) Return a list of successor nodes of n. 找父节点:DiGraph.predecessors(n) Return a list of predecessor nodes of n. 求距离某一节点(0)的最短路径: nx.shortest_path_length(G, 0, node)
2017-12-10 19:51:48 3408 1
原创 python 统计list中各个元素出现的次数
python 统计list中各个元素出现的次数利用Python字典统计利用Python的collection包下Counter的类统计利用Python的pandas包下的value_counts的类统计利用字典dict来完成统计举例:a = [1, 2, 3, 1, 1, 2]dict = {}for key in a: dict[key] = dict.get(key, 0)
2017-09-10 21:04:43 182777 11
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人