- 博客(27)
- 资源 (4)
- 收藏
- 关注
原创 Ubuntu 系统离线升级gcc版本
引言:在离线环境下,在服务器上安装并更新gcc版本是一件特别复杂的事情。这里根据自己的离线更新尝试做笔记,方便记录和记忆;gcc 版本查看:gcc --version第一步:先下载我们需要安装的gcc版本,我这里安装的是 8.1版本的,下载地址为:http://ftp.gnu.org/gnu/gcc/(可以在这里找自己喜欢的版本)第二步:将下载好的压缩包放到自己喜欢的目录下,然后解压该压缩包到目录'/usr/local/ '中: tar -zv...
2021-08-11 16:02:28
1660
原创 离线环境下手动安装python环境的依赖包
在写完python代码之后,想要部署到服务器上。但由于服务器无法连接外网,对应的服务器上也没有代码中用到的包,怎么进行手动安装,正是一件麻烦的事情,现在主要针对这样的情况介绍几种依赖包的手动安装。这里主要介绍flask和jieba的安装,关于其它包的安装,后续添加。先介绍flask安装包的安装。在 https://pypi.org/ 上下载flask安装包, Linux系统服务器的话,一般选择下载File type是source的,目前的最新版本是 Flask-1.1.2.tar.gz. 通过查...
2020-12-16 16:25:08
682
原创 python 编译pyc以及pyc包导入使用
python 编译pyc以及pyc包导入使用 目前做一个项目,为了保护源码,如何发布解析之后的二进制文件.pyc,给工程使用,这里做一个较为简单和详细的解释。一、基础概念 包:一个文件夹,用来存放模块和子包。包里一般会有一个__init__.py 的文件(也可以没有),包里一般也会有一个__pycache__文件夹,存放 .py 文件经解释器解释后的中间字节码(二进制文件)。 模块: 可以作为模块的文件有 .py ,.pyc, .pyo, .pyd, .so, ...
2020-11-18 16:16:14
7332
原创 Python 代码日志之logging的解析与使用
Python 代码日志之logging的解析与使用平时都是用别人的代码,看别人的在用logging和logger, 不知道如何使用,总是把别人的复制来复制去,今天抽空学习一下,别做个笔记,方便查阅。一、基本概念日志是一种可以追踪某些软件运行时所发生事件的方法。软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生某些事情。一个事件可以用一个可包含可选变量数据的消息来描述。此外,事件也有重要性的概念,这个重要性也可以被称为严重性级别(Level).主要作用程序调试 了解软件程序运
2020-11-17 20:41:39
489
原创 基于语法规则生成句子
在自然语言处理任务中,需要训练一个深度学习模型,但是数据集不足,下载查找合适的公开数据集比较困难,或者说再处理比较繁琐。此时,就可以采用规则的方法去生成一部分数据集以供使用;该方法的优点:(1)生成句子的速度快;(2)能够满足基本的任务需求,例如实体识别和标注任务;(3)不需要较大的资源去加载大模型,例如BERT,GPT-2;该方法的缺点:(1)生成的句子比较生硬,多样性不足;(2)如果生成不同类型的句子,需要重新设计模板;接下来,我们将从规则设计进行介绍, 然后...
2020-09-21 18:36:26
1269
转载 N个鸡蛋从M楼层摔
一、题目:有一栋楼共100层, 一个鸡蛋从N层及以上的楼层下来会摔破,在第N层以下的楼层落下来不会摔破。给你2个鸡蛋,设计方案找出N, 并且保证在最坏情况下,最小化鸡蛋下落的次数。二、 思路:先假设,最小的次数为 x 次。首先在x层楼摔,会有两个结果:1、碎了,为了找出哪一层碎了,第二个鸡蛋必需从1~x-1进行遍历的摔2、没碎,那么第二次就在x+(x-1)楼层摔。解释:...
2019-09-14 22:02:12
405
1
原创 寻找有序数组的中位数
题目:给定两个大小为m和n的有序数组num1和num2。在时间复杂度为O(log(m+n))找到该数。两个思想:(1)二分查找; (2)插入虚拟符号,让所有数组变成奇数;中位数计算的条件:L1<R2 && L2<R1中位数的值为:Value = (max(L1,L2) +min(R1,R2))/2;还有两种边界情况:...
2019-08-26 02:47:17
350
1
原创 动态存储分配问题 在C++编程中
操作符 newC++操作符 new 可以用来动态存储分配,该操作符返回 一个指向所分配空间的指针。 例如, 给一个整数分配存储空间,可以使用下面的语句。int *y;当需要使用该整数时,可以使用如下语法来分配存储空间:y = new int;操作符new 分配了一块能存储一个整数的空间, 并将指向该空间的指针返回给y, y 是对整数指针的引用,而*y则是对整数本身的引用。为了...
2019-05-13 00:45:44
847
原创 文章标题生成(HeadLine Generation for News Articles)评测指标Rouge-(1,2,L,S) 和 Meteor
文章标题生成评价指标摘要:这里是关于自动文摘生成论文中常用的相关评价指标(Rouge and Meteor )的描述.Bleu指标大家比较熟悉,这里不做过多的解释。关于Rouge 是评估自动文摘以及机器翻译的一组指标。它们过将自动生成的摘要或翻译与一组参考摘要(人工生成的)进行比较计算,得出相应的分值,用来衡量自动生成的摘要或翻译与参考摘要之间的“相似度”。Meteor 是2004年由Lavi...
2018-10-31 19:36:44
2132
原创 距离计算方法-聚类
k-均值聚类算法的性能会受到所选距离计算方法的影响;所以,今天总结了一下有关距离计算的一些总结。如有错误,望大家指正。1、欧式距离是大家最熟悉的了。比如两点之间的距离的计算。可以写成向量的运算形式,工程中用的最多。2、曼哈顿距离(Manhattan Distance)就是计算城市街区距离(一个十字路口到下一个十字口)3.切比雪夫距离(Chebyshev Distance)这个公式的另一种等价形式是...
2018-05-17 15:53:33
12218
1
转载 APP 快速开发教程(安卓)
前言本篇博客从开发的角度来介绍如何开发一个Android App,需要说明一点是,这里只是提供一个如何开发一个app的思路,并不会介绍很多技术上的细节,从整个大局去把握如何去构思一个app的开发,让你对独立开发一款app的时候有个理解,如果有说的不对的地方,欢迎大家拍砖留言讨论。开发环境Android应用层使用的开发语言是Java,自然需要用到Java运行环境,无论你在Window是系统还是Mac...
2018-03-31 22:18:29
15104
1
转载 Python 多核并行计算
Python 多核并行计算Nov 2, 2016 • python • also available in English以前写点小程序其实根本不在乎并行,单核跑跑也没什么问题,而且我的电脑也只有双核四个超线程(下面就统称核好了),觉得去折腾并行没啥意义(除非在做IO密集型任务)。然后自从用上了32核128GB内存,看到 htop 里面一堆空载的核,很自然地就会想这个并行必须去折腾一下。后面发现,...
2018-03-27 13:57:35
1045
转载 Ubuntu 安装搜狗输入法
安装完Ubuntu 16.04后,要更换为国内的软件源: sudo gedit /etc/apt/sources.list #用文本编辑器打开源列表在文件开头添加下面的阿里云的软件源:[plain] view plain copy deb http://mirrors.aliyun.com/ubuntu/ quantal main restricted universe mu...
2018-03-08 20:55:05
18295
5
原创 python3 中 pickle 使用(Cpickle python2)
1、pickle.dump(obj, file, [,protocol]) 注解:将对象obj保存到文件file中去。protocol参数,0:ASCII协议,所序列化的对象使用 ASCII码表示; 1:老式的二进制协议; 2:2.3版本引入的新二进制协议,较以前的更高效。 其中协议0和1兼容老版本的python。protocol默认值为0
2018-01-08 19:10:33
232
转载 Tensorflow 常用函数
1、tensorflow的基本运作为了快速的熟悉TensorFlow编程,下面从一段简单的代码开始:import tensorflow as tf #定义‘符号’变量,也称为占位符 a = tf.placeholder("float") b = tf.placeholder("float") y = tf.mul(a, b) #构造一个op节点 sess = tf.S
2018-01-08 17:07:34
286
原创 Highway network
Highway Network主要解决的问题是,网络深度加深,梯度信息回流受阻造成网络训练困难的问题。假设定义一个非线性变换为,定义门函数,携带函数。对于门函数取极端的情况0/1会有,而对应的门函数使用sigmoid函数,则极端的情况不会出现。一个网络的输出最终变为。具体的代码实现为:def highway(input_, size, num_layer
2017-12-23 01:50:13
3788
3
原创 BLEU 评价指标总结
Bleu 评测(一)Bleu通常用来度量一组机器产生的翻译句子集合(candidates)与一组人工翻译句子集合(references)的相似程度。Bleu的具体计算过程看下图:在这里解释一下:式中的n 为当前匹配n-gram的长度,这里的N=4(也可以是其1,2,3),是n-gram匹配权重,BP是用来对过短候选翻译的惩罚系数,是利用当前n-gram匹配对候选机器翻译基于...
2017-12-02 20:43:18
8686
3
原创 Q_learning在自然语言生成中的应用思考
Q_learning from reinforcement learning 在学习Q_learning算法之前,我们需要了解一下,一个叫做时间差分学习的(temporal difference learning)思想。它的迭代公式是:其中是每个episode结束后获得的实际累积回报,α是学习率,这个式子的直观的理解就是用0实际累积回报作为状态值函数V()的估计值。具体做法是对每
2017-12-02 20:36:35
385
原创 如何将int型变量写入文件(不需要转化为str类型)
print >> f 【要写入文件的东西】去代替 fd.write(【要写入文件的东西】)大家经过实验可以清楚的知道:fd.write()只能输入字符串,输入数字要先用str()函数转换为字符串而 print >> fd,可以直接输入int类型eg:fd = open('tmp','w')print >> fd,"Hello_world, I'm
2017-11-26 20:34:46
5042
原创 如何在Linux 系统 以及windows 系统安装 tensorflow -cpu -gpu 老版本 0.12 ,0.10
本文摘自 http://blog.csdn.net/include1224/article/details/53452824
2017-11-21 11:31:34
1301
原创 python 3.5: TypeError: a bytes-like object is required, not 'str' when writing to a file
原创:+++++++++++++++++++++++++++++++如果出现这样的错误,一般呢是Python2 与 Python 3 不兼容情况造成的:例如:with open(fname, 'rb') as f: lines = [x.strip() for x in f.readlines()]for line in lines: tmp = line.st
2017-11-19 19:06:01
767
转载 sublime 2 - 3 快捷键使用
常用快捷键:Ctrl+Shift+P:打开命令面板Ctrl+P:搜索项目中的文件Ctrl+G:跳转到第几行Ctrl+W:关闭当前打开文件Ctrl+Shift+W:关闭所有打开文件Ctrl+Shift+V:粘贴并格式化Ctrl+D:选择单词,重复可增加选择下一个相同的单词Ctrl+L:选择行,重复可依次增加选择下一行Ctrl+Shift+L:选择多行Ctr
2017-11-15 11:04:51
116
原创 如何快速去查找API帮助
请看代码:import tensorflow as tfimport numpy as npimport sklearn #import osprint(help(--------))不懂那个函数,直接在help()括号中添加,快捷,方便,前提是你需要事先导入该模块。
2017-11-10 10:14:43
1642
翻译 tf.gfile的应用 来自tensorflow官网
tf.gfile定义的位置 tensorflow/python/platform/gfile.py.函数及其作用Copy(...): 把数据从老的目录下复制到新的路径下DeleteRecursively(...): 在目录递归地删除.Exists(...): 判断路径是否存在Glob(...): 返回一个列表,给出了模式匹配的
2017-11-02 19:23:54
1109
自然语言处理任务中语言模型发展总结
2020-12-16
GNN-for-NLP-slide
2020-11-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人