- 博客(139)
- 收藏
- 关注
原创 Python 控制台输入
单行#sys.stdin.readline() numList= list(map(int,sys.stdin.readline().strip().split()))print(numList)12 23 34[12, 23, 34]strList=sys.stdin.readline().strip().split()print(strList)23 df fg 45...
2019-08-24 12:05:25 2620
原创 transform
X:包含很多信息q:查询 为了编码x 用来去查询别人的向量k:被查询的向量 q*k 就能得到需要花多少注意力去关注第一个词 去关注第二个词......... 通过softmax变成概率V:真正的语义 很多信息通过变换矩阵,变换成v 通过概率把他们加起来就变成 Z...
2019-07-31 10:05:42 144
原创 语法
https://blog.csdn.net/lanxu_yy/article/details/37700841 语法分析实际就是汇编原理中的语言类型 0型 1,2,3型无约束文法 上下文无关文法(歧义) 上下文有关文法 正则文法(两个用的比较多)...
2019-07-24 22:32:32 106
原创 词法
词法分析(分词):英文时态 中文分词分词主要问题:未登录词 词性标注主要问题:消除词性岐意 ==》 把有歧义的词建个表 ==》识别规则 排比 形容词 绿茵茵=》基于字的词法分析:将每个字打上标签进行分析 有利于处理未登录词 ...
2019-07-24 22:17:04 112
原创 个性化推荐算法
根据用户行为历史 或 给相似用户推荐相似产品不同于内容上衡量物品相似度 协同过滤衡量物品相似是基于用户行为 如果喜欢两个物品的用户重合度越高 两个物品就越相似u(i) =>对物品 i 有过用户行为的集合 rui 表示用户对i的行为得分的归一化 sij 物品ij的相似度得分 puj 对user进行item ...
2019-07-16 17:09:08 1487
转载 CRF
隐马尔科夫模型定义隐马尔可夫模型是关于时序的概率模型,描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列的过程。隐藏的马尔可夫链随机生成的状态的序列,称为状态序列(state sequence);每个状态生成一个观测,而由此产生的观测的随机序列,称为观测序列(observation sequence)。的每一个位置又可以看作是...
2019-07-12 08:17:05 383
原创 tensorflow 梯度下降原理
minimize ==>def compute_gradients(self, loss, var_list=None, gate_gradients=GATE_OP, aggregation_method=None, colocate_g...
2019-07-11 16:25:05 645
原创 二进制 加减乘除
题目描述写一个函数,求两个整数之和,要求在函数体内不得使用+、-、*、/四则运算符号。解题思路第一步:两个数按位取亦或。获得的值为不考虑进位时的和。第二步:两个数按位取与。获得的值为(当两个数某一位同为1时)两个数求和时需要进位的位置。每次讲该数(在代码中表示为num2)左移一位,表示进位后。循环第一二步,直至两数的和没有进位位为止。class Solution: de...
2019-07-10 21:47:41 850
转载 约瑟夫环
https://blog.csdn.net/u011500062/article/details/72855826约瑟夫问题约瑟夫问题是个著名的问题:N个人围成一圈,第一个人从1开始报数,报M的将被杀掉,下一个人接着从1开始报。如此反复,最后剩下一个,求最后的胜利者。例如只有三个人,把他们叫做A、B、C,他们围成一圈,从A开始报数,假设报2的人被杀掉。首先A开始报数,他报1。侥幸逃过...
2019-07-10 19:23:57 128
原创 斐波那契数列
递归时间复杂度:2^n循环:n还有一种矩阵的方法:不适用 只是针对性的解法通过反推,其实它是两个矩阵的乘积得来的依此类推:最后可推出:因此想要求出F(n)的值,只要能求出右边矩阵的n-1次方的值,最后求得两矩阵乘积,取新矩阵的第一行的第一列的值即可,比如n=3时,可以得知F(3)的值2,F(2)的值为1,因为幂运算可以使用二分加速,所以矩阵法的时间复杂...
2019-07-08 21:54:34 175
原创 顺序表 链表
p!=None 代表最后一个元素 且 p.next=Nonep.next!=None 代表最后一个元素前面一个元素python 中变量名存储的是 地址赋值的意思是把地址导向变了一下 变量名存储的是地址其他语言中定义一个变量会声明类型,此时变量a代表的就是真实数值所在的地址在python中,声明变量没有类型,变量名是有自己的内存的,存放的...
2019-07-07 23:09:21 301
原创 枚举法 列表 字典追加对比
extend(+=) < append < list(range())构造列表 < 列表生成式 插入头部最耗时算法:处理思路处理顺序 数据结构:数据存储结构,数据怎么存 数据拥有的功能:增 删 改 查 排元素外置实现列表存储不同类型的数据顺序表连续存储 分离存储...
2019-07-07 11:54:12 622
原创 source
https://github.com/JackKuo666/Data_Structure_with_Python pythonpython 中的集合 列表 元组 字典 set目录Data_Structure_with_Python0.0.算法效率衡量对于算法的时间效率,我们可以用“大O记法”来表示。最坏时间复杂度时间复杂度的几条基本计算规则常见时间复杂...
2019-07-07 10:44:28 134
原创 BiLSTM
https://blog.csdn.net/ifruoxi/article/details/78235270 BILSTMhttp://colah.github.io/posts/2015-08-Understanding-LSTMs/https://codertw.com/%E7%A8%8B%E5%BC%8F%E8%AA%9E%E8%A8%80/621376/在tensorflo...
2019-07-04 21:55:38 2308
转载 textCNN
https://blog.csdn.net/John_xyz/article/details/79210088 原理https://www.cnblogs.com/jiangxinyang/p/10207482.html 实现https://blog.csdn.net/loseinvain/article/details/78935192 卷积tf.nn.conv2d()使用...
2019-07-03 22:03:57 414
原创 Git 切换路径 执行.sh 文件
cd C:/Users/Administrator/PycharmProjects/OwnWiki/OwnWiki/src假设你有一个脚本script.sh。运行它(使用Git Bash),你做了以下chmod +x script.sh./script.sh你可以改变chmod到您想要的可执行权限。那些都可以找到这里。注意:chmod只需要运行一旦。跑....
2019-07-03 09:24:54 7099
原创 算法时间效率
看最有效的执行次数 第三部分代表执行次数K/t表示 中间是等于的目标https://www.bilibili.com/video/av50121598/动态搜索 回溯 递归 常考...
2019-06-30 10:28:42 266
原创 word2vec
https://www.cnblogs.com/pinard/p/7249903.html 3/4 很好4.Negative Sampling负采样方法 现在我们来看看如何进行负采样,得到neg个负例。word2vec采样的方法并不复杂,如果词汇表的大小为VV,那么我们就将一段长度为1的线段分成VV份,每份对应词汇表中的一个词。当然每个词对应的线段长度是不一样的,高频词对应的线段...
2019-06-27 20:19:27 618
原创 迁移学习
以google inception 为例有三种方法:1.上百万张图片直接自己训练2.直接在池化层后面接自己的输出层 用池化层前面的数据 只训练后面的输出层 吧1000的分类转为自己的分类3.在后面接神经元,对整体进行训练,但先面的学习率设置的很小 对前面进行微调...
2019-06-27 12:29:58 153
原创 重要的CNN网络 知识及对比
https://blog.csdn.net/u010402786/article/details/52433324 Google inception
2019-06-27 11:13:16 438
原创 CNN代码
import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data#每个批次的大小batch_size = 100#定义初始化权值 在卷积层中 是卷积核 在全连接层是权值 和偏置def weight_variable(shape): initial=tf.truncated_n...
2019-06-27 09:38:36 4216
原创 word2vec
目录数据稀疏解决办法:一般说一句话的一个词一般依赖于前面1、2个词 所以一般预测一个次并不是考虑前面所有词 而是考虑前面相邻的几个词 n-gram 有点马尔科夫性的意思但n_grams是基于词频的有时序性的 空间逻辑有相似性的不能用简单频率计算one-hot:数据稀疏 词转化的向量之间没有语义联系对应解决办法 word2vec 同一语言相似语义在一起...
2019-06-23 21:41:10 135
原创 循环网络 2017nips主题
增强学习 GAN 深度学习用于其他隐马尔科夫模型:参数过多RNN:梯度裁剪:防止梯度爆炸绝对值很大会以一定比例减小 绝对值很小 保持不变 正向传播 反向传播:正向传播是已知输入和参数求中间值和输出值,反向是利用求出来的值去反推参数W和B的导数,然后梯度下降批量采样:图片直接一个或几个取 这里取一次取几个词...
2019-06-22 19:39:59 159
原创 Fine-tuning:通过微调来迁移学习
在原数据集上 用大量数据训练模型 通过微调直接用到实践中迁移学习思想:如果只有一个小数据集 训练模型最后得到的模型效果可能不太好 此时考虑可以有没有在大数据集上有没有训练好的模型把除了最后一层的模型直接copy过来 对最后一层初始化 在进行训练image fine-tune模型...
2019-06-22 12:11:14 748
原创 优化算法 优化器
目录数据量的角度 3个:一般用的梯度下降方法:数学角度 梯度下降:一般梯度下降:随机梯度下降:小批量梯度下降:梯度下降 学习率比较:从梯度大小方向上考虑:都是基于股票上的EMS思想 (Exponential Moving Average)是指数移动平均值。 动量梯度下降法 + RMSprop =Adam动量梯度下降法:加快梯度下降RMSpro...
2019-06-22 11:49:19 276
原创 使用Gluon对原始图像文件分类(CIFAR-10) 个人小结
想自己调参不走捷径的话请忽略以下内容===================== SPOILER ALERT!!! ========================我来分享一下我以前自己train cifar10的经验。 调参的话基本上根据resnet和densenet两篇paper。 我之前用最大的densenet的话val 可以到96.5%-96.7% 不过8卡titan x train...
2019-06-22 09:47:04 499
原创 NiN
1.全用卷积 不用全连接 a。用全连接模型会比较大 AlexNet模型大小700M 400-500M是最后全连接 b。全连接 容易过拟合 需要加入dropout 批量归一 =》要调参 效果不一定那么好2.用小网络 看起来比较小的完整的网络嵌在一起 1*1卷积核...
2019-06-21 23:06:42 637
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人