- 博客(31)
- 收藏
- 关注
原创 朴素贝叶斯python实现
本实现仅仅是课本上的实现,仅供学习参考和sklearn实现不同朴素贝叶斯的实现主要分为三步,本文按照三个步骤来实现,我们假设S为样本集合,包含N个样本,样本的特征维度为n1.计算先验概率,表示类别对应的概率2.计算条件概率表示个类别中第个维度的特征为的概率3.计算最大化后验概率为了防止概率很小溢出,一般取对数,再比较大小1.主要代码实现结合字典和元组来存储统计结果,注意元组是不可变数据类别是可以作为字典的key的,而列表等可变数据类型不能作为字典的key1. 计算先验概.
2021-04-02 10:41:43 869 4
原创 比赛名次确定的个数
未完待续华为机试,没撕出来《*——*》名次确定的次数核心思路,某个队伍左边的队伍个数和右边的队伍个数为n-1,那么这个队伍的名次是确定的,左边的队伍个数为这个队伍的名次#include <iostream>#include <cstdio>#include <cstdlib>#include <cstring>using namespace std;#define maxn 106int n, m;bool g[maxn][
2021-02-24 21:46:44 259
原创 堆排序
字节面试考到的知识点,对输入整数数据流取中位数,面试当时想到了单调队列的方法,维护一个单调队列总的时间复杂度为,现场没撕出来,后来去leetcode提交最后一个测试案例超时不过想法应该是对的,后来看答案是用堆的调整,复习下堆排序,1.堆排序c++实现1.1 准备排序需要借助一个交换函数swap可以自己实现也可以用c++的实现#include<bits/stdc++.h>using namespace std;void swap(int arr[], int a, in
2021-02-16 14:32:34 217 1
原创 解决Did you mean to set reuse=True or reuse=tf.AUTO_REUSE in VarScope?
ValueError: Variable seq2seq/decoder/attention_v already exists, disallowed. Did you mean to set reuse=True or reuse=tf.AUTO_REUSE in VarScope?这个错误是在测试的时候遇到的,训练没有问题,开始还以为是重复定义相同的变量名,后来才明白,之前运行的模型加载到内存中没有清空就开始第二次运行,会导致tensorflow检查到两次变量名相同。解决方法,在第二次构建计
2021-01-25 20:40:51 2660
原创 python使用3种方法实现auc评价指标
python实现常见的评价指标confusion matrix: 预测正例 预测负例真正例 tp fn真负例 fp tnprecision 表示预测为正例的样本中 正确预测的样本个数,从预测的角度看有多少预测正确precision = tp / (tp + fp)recall 表示正样本中, 有多少被预测为正例,从标注角度看有多少被召回recall = tp / (tp + fn)F1 = 2*precision*r...
2021-01-21 14:28:55 1615 2
原创 神经网络方法的范式——paradigm
神经网络的范式(paradigm)总结nlp各种任务,基本都可以用一个范式来概括,那就是分类,本人总结看过的nn论文,目前看到的所有的任务nn虽然各有不同,但是最终都回归到各种粒度的分类上面。Y = softmax(Nerual network(X,W)) 或者 sigmoid(Nerual network(X,W)), X式输入的文本图像视频语音,W式可学习的参数,Nerual Network是我们搭建的模型比如rnn,lstm,cnn,bert等等,Y是预测的目标对应概率,实际上就是做一个分类。
2020-08-29 15:59:09 621
原创 dfs和回溯
很多问题动态规划比较难想,dfs就可以用来兜底,再加上合适的剪枝就成了回溯,有时候可能比dp更快,dfs感觉比递归更好理解,一般都可以使用二叉树或者图的方式来理解。一般用回溯能解的一定能用dfs解因为dfs是遍历了所有的解。回溯遍历的解是dfs的子集目录01背包问题dfs求解回溯求解01背包问题dfs求解回溯求解...
2020-08-27 21:36:22 2004
原创 Incorporating External Knowledge to Answer Open-Domain Visual Questions with Dynamic Memory Networks
论文简介 改论文主要引入了外部知识使得封闭领域的视觉问答(VQA-visual question answering)任务变为开放领域的视觉问答,任务形式化:输入:一张图片+围绕图片的问题+根据问题在知识图谱中检索的外部知识(论文中使用三元组)输出:问题的答案(一般有4个候选类别)外部知识的获取这一步显然是很关键的,如果获取有用的外知识是模型有效的先决条件。由于输入是图片和问题文本,对于图片作者使用FatsRCNN(用于目标检测的模型,首先FastRCNN应该是预...
2020-08-15 18:57:49 326
原创 百度AI studio配置tensorflow环境
之前做了ai studio 安装pytorch环境的教程后来发现tensorflow也是可以安装的。由于ai studio默认python环境只有2.7和3.7有些tensorflow版本是装不了的,注意以“!”开头的脚本可以在notebook执行,没加的最好在终端执行我这里的教程可以自己选择安装任何版本的tensorflow,安装之前注意自己的python版本,tensorflow版...
2020-03-22 11:01:38 8642 47
原创 百度AI studio配置pytorch环境
百度的AI studio真的是良心了,V100显卡,显存16G,免费的卡,虽然平台主张使用paddle paddle其实pytorch也是可以用的按道理tensorflow也是可以用,但是cuda出现一点问题,虽然可以配置pytorch环境但是每次重启服务器之后又要重新配置pytorch,如果要配置的环境比较多的话,安装时间也是需要考虑的问题,还是不太方便,我猜百度是随机分配服务器的,所以这只适合...
2020-03-18 17:18:56 11887 23
原创 使用pycallgraph和Graphviz可视化函数的调用关系-可用于cnn或者rnn的可视化调用
第一步:先安装pip installpycallgraph和graphviz第二步:http://www.graphviz.org/download/ 在官网上找到 graphviz-2.38.smi文件直接按照,注意记住按照路径,第三步:配置bin文件的用户环境目录和系统环境目录,用户环境目录是 path\grapgviz_name\bin,系统环境path\grapgviz_na...
2019-12-31 14:42:11 1117
原创 ValueError: Dimensions must be equal, but are 16 and 28 for 'seq2seq/decoder/train/decoder
ValueError: Dimensions must be equal, but are 16 and 28 for 'seq2seq/decoder/train/decoder/while/BasicDecoderStep/lstm_cell/MatMul_4' (op: 'MatMul') with input shapes: [2,16], [28,40]运行tensorflow代码出...
2019-12-04 17:38:25 1311
原创 运行tensorflow程序bug:Process finished with exit code 139 (interrupted by signal 11: SIGSEGV)
这个bug是我在运行tensorflow代码时出现的,但是实际的原因不是代码本身的问题,应该是cpu占用太高或者内存不够的文问题下面是我收集的各种可能出现这个错误的,以下错误都进行了来源引用,备注:如有侵权请联系删除。Processfinishedwithexitcode139(interruptedbysignal11:SIGSEGV)Processfini...
2019-11-28 11:46:32 2729
原创 学习tensorflow从“tensor”开始
学习tensorflow一定要先从tensor开始,tensorflow是什么,他就是一种tensor计算框架,简单来说就是tensor+tensor_op也就是张量和在张量上的操作,如果你掌握了tensor和大部分的常用tensor op我觉得tensorflow就掌握得差不多了。然后tesor op就是张量操作这个东西其实是比较麻烦得一个事情。反正比较多,不可能一下子全部掌握。而且如果你不理解...
2019-11-27 17:48:39 184
原创 Common sense Knowledge Aware Conversation Generation with Graph Attention阅读笔记
这篇文章是基于图注意力的对话生成,这篇文章的内容,简单概括来说就是一个concpetNet知识图谱(常识库),3个注意力,一个copy mechanism.将论文公式和论文的代码结合起来我觉得是一种很好的学习方法,所以下面我会这种方式介绍这篇论文。备注:如有错误欢迎批评指证,欢迎评论转发1 背景1.1 问题定义input:{x1,x2,...,xn},output:{y1,y2,...
2019-11-20 21:27:59 1059 2
原创 python爬虫的原理
先上代码再解释:# 事先声明,运行环境:win10,pycharm+python3.5,Any question will be valued!# 代码是根据这个修改的原来是python2,http://www.maiziedu.com/wiki/crawler/example/,为了进行一步理解python爬虫的原理,这个基础只之上进一步做出了修改,下面的url可以换成任意的网页,但是编...
2019-09-24 14:50:23 400
原创 Topic-to-Essay Generation with Neural Networks阅读笔记和部分实验
备注:一下除了图片是论文中的,其它全部是原创。1 问题描述:根据5个给定的话题词,生成一篇短文,要求大概就是这篇短文起码要通顺把,然后5个话题都要出现在这篇短文当中。2 数据集介绍:作者自己构建了两个数据集,一个是作文的数据集,另外一个是zhihu数据集,感觉作文的数据集数据质量比较高,zhihu的数据集质量比较差一点,而且作文数据集5个话题全部出现在了生成的短文里面,而zhi...
2019-07-01 13:38:25 1767 16
原创 关于tensorflow和tensorboard版本问题
由于最近将tensorflow cpu换成了gpu版本,导致之前的tensorboard不能使用了,各种百度,google还是没能解决,网上没有类似的错误提示。其实是由于版本问题,感觉python配置环境啥的都是因为版本问题导致的不兼容,这里总结一下之前遇到的各种坑。要么是因为python的版本问题,还有各种库的版本,一般来说,按照时间来算,各种库的版本发行的时间比安装的python版本的要稍...
2019-05-20 09:35:43 20035 8
原创 Training Products of Experts by Minimizing Contrastive Divergence阅读笔记
Hinton大牛的对比散度阅读笔记个人感想:为了看懂这篇论文查了大量资料,感觉很多博客的理解讲得不是很清楚,大多数是关于对比散度在RBM中的应用。后来跟老师讨论了一下感觉已经大致理解了这篇文章的核心思想。另外大部分公式是自己手动敲的,欢迎大家评论转载,哈哈哈哈!1.PoE模型什么是PoE(product of experts)模型呢,更确切地说他应该是一种思想,就是把很多个...
2019-05-19 22:15:44 1685
原创 技巧:把字符常量存放在string类型中
1.string类型是一个指针,用char a[10]为其赋值时直接用首地址a即可,这样可以把字符常量存放在string类型中,当字符常量的输入大小未知时,可以用此方法。2.string类型不能用printf输出,最好用cout输出。#include<iostream>#include<string>using namespace std;int m...
2019-03-13 12:22:48 419
原创 win10tensorboard可视化
第一步:定义图的结构,每个结点都是tf.Ops_name()形式,有多少个这个的形式说明有多少个结点第二步:运行图会话进行计算,保存日志文件tf.summary.FileWriter(r"日志文件的保存路径",sess.graph)第三步:打开cmd,直接输入 tensorboard --logdir=日志文件的保存路径(注意这里不需要加引号)第四步:打开Google ...
2019-03-13 12:07:27 432
原创 ELMo模型解读
在反复的看了ELMo源码和参考网上各路大神的经验之后,终于对ELMo的架构有了比较清楚的认识。总结一下自己对ELMo的理解,其实还有很多细节没有搞清楚。一.模型架构下面是我画的一个架构简图,对于ELMo不管你输入的是词还是字符,它都会以字符的单位进行后续的字符卷积,对与词的索引是根据词典序号索引的,而字符论文说英文的字符加上一些特殊的标记字符总共不会超过262个...
2019-03-03 20:52:25 9299 6
原创 经常出现的错误和经验总结和一些技巧不定期更新
1cout<<Maxname<<" "<<MaxID<<endl;//注意string类型不能用printf输出,否则会出错//要把字符串类型当做像int 自动变量那样可以写 可以用string类型的数组,//但是注意此时string类型的输入和输出都只能用cin和cout//cin该操作符是根据后面变量的类型读取数据。//输入结束条件 :遇到Ent...
2018-03-04 16:33:33 269
原创 1009. 说反话 (20)
#include<iostream>#include<string.h>using namespace std;int main(){ int right; char str[81]; gets(str); right=strlen(str)-1; for(int i=strlen(str)-1;i>=0;i--){ if(str[i]==' ...
2018-03-04 16:30:08 130
原创 1008. 数组元素循环右移问题 (20)
#include<iostream>#include<algorithm>//#include<Windows.h>using namespace std;int main(){ int M,N,a[100]; scanf("%d %d",&N,&M); for(int i=0;i<N;i++){ scanf("%d",&
2018-03-04 16:29:15 137
原创 1007. 素数对猜想 (20)
#include<iostream>#include<cmath>int Isprime(int n);//#include<Windows.h>using namespace std;int main(){ int N,left,right,num=0; scanf("%ld",&N); if(N<5) printf("0\n"); else...
2018-03-04 16:28:22 108
原创 1006. 换个格式输出整数 (15)
#include<iostream>void printnB(int n);void printnS(int n);void printg(int n);//void deci2hanzi(int n);//#include<Windows.h>using namespace std;int main(){ int n,a,b,c; scanf("%d",&n...
2018-03-04 16:20:41 97
原创 1004. 成绩排名 (20)
#include<iostream>#include<string.h>#include<string>//void deci2hanzi(int n);//#include<Windows.h>//int AllIsA(char str,int low,int high);using namespace std;int main(){ int n...
2018-03-04 16:19:49 139
原创 1002. 写出这个数 (20)
#include<iostream>#include<string.h>void deci2hanzi(int n);//#include<Windows.h> //标准C++语言没有这个头文件,在OJ上提交时不能加上using namespace std;int main(){ char str[100]; scanf("%s",str); int ...
2018-03-04 16:18:37 132
原创 string类型使用技巧
1.string类型是一个指针,用char a[10]为其赋值时直接用首地址a即可,这样可以把字符常量存放在string类型中,当字符常量的输入大小未知时,可以用此方法。2.string类型不能用printf输出,最好用cout输出。#include#includeusing namespace std;int main(){char str[10];sca
2017-12-31 20:24:20 268
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人