雅honghong啊-CSDN博客

原创二叉树的非递归后序遍历（python）附带建树过程

# 本代码包括建树过程class TreeNode: def __init__(self, x): self.val = x self.left = None self.right = None # 建树 def creatTree(data, index): pNode = None if index < len...

2019-08-09 19:21:50 864

原创堆排序python3实现

def heapfiy(nums, n, i): largest = i l = 2 * i + 1　　# 左孩子 r = 2 * i + 2　　# 右孩子 # 父亲节点和左孩子右孩子节点的值比较 if l < n and nums[i] < nums[l]: largest = l if r < n and num...

2019-08-06 09:06:57 394

原创快速排序的实现　python3

def quick_sort(nums): If len(nums) >= 2: data= nums[0] left, right = [], [] nums.remove(data) for num in nums: If num >= data: right.append(num) else: left.append(num) r...

2019-08-05 13:39:11 190

原创根据数组创建完全二叉树并求出和为某一值的所有路径(python)

最近做了一家公司的笔试题，是求出一棵数中和为一个固定值的所有路径，看到这个题的第一感觉，简单！写的时候懵逼了，因为他输入的是数组，首先要根据数组建一个二叉树，才能进行后续的算法．虽然想法很简单，以前也会，时间长没写全忘了，过不过随缘吧．．．．# 定义树的数据结构class TreeNode(object): def __init__(self, x): self.val...

2019-07-31 11:14:21 883 2

原创面试笔试编程题（四）

(九)单词拆分 II给定一个非空字符串 s 和一个包含非空单词列表的字典 wordDict，在字符串中增加空格来构建一个句子，使得句子中所有的单词都在词典中。返回所有这些可能的句子。说明：分隔时可以重复使用字典中的单词。你可以假设字典中没有重复的单词。示例 1：输入:s = “catsanddog”wordDict = [“cat”, “cats”, “and”, “sand”, ...

2019-06-21 21:03:54 209

原创面试笔试编程题（三）

验证回文串给定一个字符串，验证它是否是回文串，只考虑字母和数字字符，可以忽略字母的大小写。说明：本题中，我们将空字符串定义为有效的回文串。示例 1:输入: “A man, a plan, a canal: Panama”输出: true示例 2:输入: “race a car”输出: falsedef huiwen(self, s): if not s: return Tr...

2019-06-14 16:42:47 250

原创面试笔试高频编程题（二）---鸡蛋掉落问题

鸡蛋掉落你将获得K个鸡蛋，并可以使用一栋从1到N共有N层楼的建筑。每个蛋的功能都是一样的，如果一个蛋碎了，你就不能再把它掉下去。你知道存在楼层F，满足0 <= F <= N任何从高于F的楼层落下的鸡蛋都会碎，从F楼层或比它低的楼层落下的鸡蛋都不会破。每次移动，你可以取一个鸡蛋（如果你有完整的鸡蛋）并把它从任一楼层X扔下（满足...

2019-06-08 11:35:48 1335 1

原创经典面试题：对于二分类问题，当训练集中正负样本非常不均衡时，如何处理数据以更好的训练分类模型？

首先，造成分类模型在数据不均衡时出现问题的原因是模型在训练时优化的目标函数和在测试时使用的评价标准不一样。具体来说，（1）训练和测试时数据的样本分布不一致，训练时正负样本比例为1:99，而测试时样本比例为1:1。（2）训练阶段和测试阶段不同类别的权重不一致。根据上述原因，从两个角度处理样本不均衡问题。（1）基于数据的方法随机过采样：从少数类样本中随机重复有放回的抽取样本以得到更多样本。...

2019-06-04 21:34:58 15712 7

原创面试笔试高频编程题(一)

1.只出现一次的数字给定一个非空整数数组，除了某个元素只出现一次以外，其余每个元素均出现两次。找出那个只出现了一次的元素。示例 1:输入: [2,2,1]输出: 1示例 2:输入: [4,1,2,1,2]输出: 4解法一：考察异或，两个相同的数异或结果为0,0和任何数异或结果为任何数。解法二：用一个字典保存数以及出现的频率，返回value值为1 的数def onetime(se...

2019-06-04 18:49:15 371

监督机器学习问题无非就是“minimizeyour error while regularizing your parameters”，也就是在规则化参数的同时最小化误差。最小化误差是为了让我们的模型拟合我们的训练数据，而规则化参数是防止我们的模型过分拟合我们的训练数据。多么简约的哲学啊！因为参数太多，会导致我们的模型复杂度上升，容易过拟合，也就是我们的训练误差会很小。但训练误差小并不是我们的最...

2019-05-31 09:51:32 336

原创 python实现字典树（Trie树/前缀树、单词查找树）

Trie树的介绍网上已经有很多了，不懂的同学自行去学习昂！下面实现Trie树：class Trie: def __init__(self): self.root = {} # 这里用一个字典存储 self.end_of_word = '#' # 用#标志一个单词的结束 def insert(self, word: str): node = self.root f...

2019-05-28 09:39:33 3961

转载最详细的降维方法PCA的数学原理

https://www.cnblogs.com/mikewolf2002/p/3429711.html

2019-05-26 16:40:24 506

原创 TypeError: 'DataFrame' objects are mutable, thus they cannot be hashed

在使用pandas的get_dummies()函数的时候，出现错误：下面是我的dataframe:下面是我想把data里面的rank进行one-hot编码，利用pad.get_dummies函数：意思就是dataframe是可变的，我改了一下代码就好了，其实也不知道为什么，所以看见的同学如果知道请告诉我为什么。...

2019-04-16 11:24:05 10782 2

原创 np.array和np.asarray的区别

array和asarray都可以将结构数据转化为ndarray，但是主要区别就是当数据源是ndarray时，array仍然会copy出一个副本，占用新的内存，但asarray不会。重点是对这句话的理解，也就是说只有当元数据本来就是ndarray的时候，两者才有区别。当元数据不是ndarray，比如：列表，两者没有区别，都是将数据转化为ndarray。可见，当元数据为ndarray时，np.a...

2019-04-10 11:41:25 590

原创 numpy最基本的知识

1.创建数组的4种方法：一维：a = np.array([0,1,2,3,4])，二维：a=np.arrary([[1,2,3], [4,5,6]])；b=np.array((0,1,2,3,4))；c=np.arange(5)； # [0,1,2,3,4]d=np.linespace(0, 2*np.pi, 5 )切片a[0]a[:, 1] ...

2019-04-08 12:42:51 179

原创 InceptionV1: Going Deeper with Convolutions算法实现

实现InceptionV1结构def Inception_block(x, num_filter_for_each_path, name): """ Args: -x: inputs -num_filter_for_each_path: [10, 20, 30],池化层输入通道数和输出通道数一样 -name: variable scope name ...

2019-04-05 20:22:41 268 2

原创 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 总结

神经网络存在的问题：第一：训练深度神经网络的复杂性在于，每层输入的分布在训练过程中会发生变化，因为前面的层的参数在整个训练过程中都会发生变化。第二：较低的学习率和仔细的参数初始化不仅减慢了训练，并且使具有饱和非线性的模型训练起来非常困难（在反向传播时会引起梯度消失）。这种现象称为内部协变量转移。在实践中解决这两个问题的方法：第一：使用relu激活函数（优点：激活区间不受限制；收敛速度快；计...

2019-04-05 10:13:27 157

原创 InceptionV1: Going Deeper with Convolutions总结

第一：增加网络的最直接办法就是增加尺寸，这不仅包括增加网络的深度–网络的层次数目，也包括增加网络的宽度–增加每一层单元的数量。这是学习一个高质量模型最容易安全的方法。第二：但是这会引发两个问题：（1）越深得网络参数越多，那么模型越容易过拟合；（2）过深的网络会浪费更多的计算资源。第三：实际上，到训练后期，模型的参数大多数接近于0，那样会浪费大量的计算资源。所以解决这两个问题的方法就是引入稀疏性...

2019-04-04 22:35:13 165

原创 Deep Residual Learning for Image Recognition中算法（resnet-34）的实现

# 实现一个残差块def residual_block(x, num_filters): """如果输出通道数增加,则残差块降维+通道数增加，则恒等映射x也需要降维+增加通道数（pool+tf.pad）""" """[] X 1""" """resnet沿用了vgg的原则，每一次subsampling,则通道数增加""" x_channel = x.get_sh...

2019-04-04 11:10:29 518

原创 Deep Residual Learning for Image Recognition总结

第一：我们希望神经网络能够提取出图像上low/mid/high各种level的特征，深层网络能够做到这一点，而且提取出来的特征越是抽象，越能表达出图像的语义信息。第二：但是一味的追求深层网络，就会出现梯度弥散/梯度爆炸，解决这个问题的方法：归一初始化（normalized initialization）和中间归一化（intermediate normalization），这使得数十层的网络在反向...

2019-04-04 11:05:32 2922

原创 ValueError:Variable weights already exists, disallowed.Did you mean to set reuse=True or reuse it?

在定义数据流图的时候遇到此类错误，参数W使用get_variable获取，只需要在定义数据流i图的最开始加上重置图代码就可以拉：tf.reset_default_graph()

2019-04-02 17:32:58 1544

原创 TypeError:softmax() got an unexpected keyword argument axis

更新升级tensorflow: pip install tensorflow==1.8.0再重启一下编辑器，就可以拉！

2019-04-02 17:31:41 112

原创使用keras下载mnist数据集的问题

首先，下载mnist数据集到本地，下载地址：https://s3.amazonaws.com/img-datasets/mnist.npz保存到一个文件夹中，然后编码：(x_train, y_train), (x_test, y_test) = mnist.load_data(’/home/mayahong/NLP/TensorFlow/tensorflow-101-master/mnist/...

2019-04-02 17:30:02 2766

原创在ubantu下搭建Tensorflow开发环境

第一步：安装Python开发环境安装成功后，键入python --version查看python版本第二步：安装pip同样，pip --version第三步：安装virtualenv,在虚拟环境下安装tensorflow,有利于将tensorflow的各个版本下运行的项目隔离。sudo pip install -U virtualenv第四步：创建Python虚拟环境virtuale...

2019-04-02 17:29:00 197

原创加载InceptionV3模型到Session中，获取所有节点的name，并获取某一层节点的张量

![在这里插入图片描述](https://img-blog.csdnimg.cn/20190325212830362.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MzIwNDEyOA==,size_16,color_...

2019-03-25 21:29:08 454

原创 python的list类型用法之+= ，append, extend的区别

可以看出，append shi直接在原来的列表上追加一个列表，追加的列表占一个索引位置。+=：就是两个列表合并成为一个新的列表extend:和+=作用一样

2019-03-25 13:51:08 424

原创 python3出现UnicodeDecodeError: 'ascii' codec can't decode byte 0x98 in position 0: ordinal not in rang

在用pickle反序列化一个文件时,出现以下错误：尝试了各种解决方法后，发现在这块python3和python2的解决方式差别很大，就不赘述了！后来想起来之前做的项目同样用pickle读取一个文件,改成下面这样就对了：...

2019-03-25 10:58:49 691

原创 tensorflow加载预训练好的模型图(.pb文件）

千万不要试图在jupyter notebook中打开.pb模型文件，否则你会得到：这时候我以为shi编码的问题，开始转换编码，转换完成后发现shi乱ma。后来网上查了，.pb文件里面存储的shi模型图，其实就是个二进制字符流文件，这时候体现出tensorboard的强大了。然后打开log所在目录：输入：tensorboard --logdir=./log/ --port=6006就可以揭...

2019-03-25 10:12:58 9627 5

原创 jupyter 查看.txt文件出现“not utf-8 encode, saving disallowed”错误

这jupyter 查看.txt文件出现“not utf-8 encode, saving disallowed”错误里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的...

2019-03-19 20:32:59 11176 1

原创自然语言处理中的语言模型

语言模型的任务是预测每个句子在语言中出现的概率。计算一个句子的概率：p(S)=p(w1)p(w2|w1)p(w3|w1,w2)…p(wm|w1,w2,w3…wm-1)，假设一门语言的词汇量为V,那么需要V的m次个参数1.n-gram模型为了控制参数的的取值，n-gram做了一个历史假设：当前单词出现的概率仅与前面的n-1个单词相关，因此以上公式可以近似为：n-gram模型的参数一般采用最...

2018-12-01 15:36:29 327

weixin_43204128的博客