自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

转载 Colab | Google drive授权及工作路径

谷歌爸爸的colab让我们有了免费使用gpu的机会,在此感谢磕头哐哐哐!(不过每次只能连续使用12小时的GPU,搜了一下也有人说会随机断开连接,避免你长时间使用,但我至今还未遇到这个问题)这篇文章主要介绍如何更改工作路径和挂载google drive。本文参照robinfly所写博客:【colab入坑系列 · 一】Google drive授权及工作路径,如果有侵权问题请联系删除。Google...

2019-04-27 01:09:16 6312 1

原创 使用Moses脚本进行数据预处理

文章将介绍在机器翻译时需要使用到的数据预处理方法,包括tokenize、truecase、bpe等等,好的预处理方法才能提升机器翻译的质量。下文会以en-de双语为例进行讲解。Moses这是Moses的github地址,它是一个统计机器翻译模型,我们主要使用里面的perl脚本进行数据预处理。所以确保电脑上已经安装配置好了perl(ubuntu自带)。Normalize punctuation...

2019-04-23 23:28:30 4490

原创 jupyter notebook使用虚拟环境

首先进入已创建的虚拟环境activate you_env接着安装nb_condaconda install nb_conda就ok啦,打开jupyter notebookjupyter notebook

2019-04-17 16:45:28 252

原创 使用nltk报错:ModuleNotFoundError: No module named 'nltk.book'; 'nltk' is not a package

明明使用nltk.download()把book给下载下来了,可是仍然报错:ModuleNotFoundError: No module named 'nltk.book'; 'nltk' is not a package原因很简单。。你的python文件也不能命名为nltk……(滑稽)...

2019-04-01 10:31:41 2839 1

原创 用selenium实现一个简单爬虫,下载网站文件

selenium的安装与使用selenium是一个浏览器自动化测试工具,用它可以模拟浏览器点击等操作pip install selenium接下来以Chrome为例,需要下载浏览器的web driver,才能进行使用。在这个镜像网站上可以下载chrome driver,可以查看自己当前的浏览器版本下载对应的driver,并放到和你代码同一级目录下。关于其他selenium的介绍和方法...

2019-03-18 12:09:58 2064

原创 pip安装pyautogui时报错:UnicodeDecoderError

若pip安装pyautogui库是出现以下错误:原因是pygetwindow的版本过高或者未安装,运行命令:pip install PyGetWindow==0.01pip install pyautogui就可以正常安装了

2019-03-18 09:05:42 661

原创 matlab图像操作与空间滤波

使用matlab进行图片操作与空间滤波两幅尺寸大小不同的图像进行连接例如,两幅图像的高(宽)不同,把高度(宽度)较大的图像等比例缩小,使得两幅图像的高度(宽度)一致,然后把两幅图像横着(竖着)连接起来并显示。img1 = imread(path1);img2 = imread(path2);[h1, w1, i1] = size(img1);[h2, w2, i2] = size(im...

2018-11-01 20:42:50 924

原创 在Anaconda创建虚拟环境以及在pycharm中使用虚拟环境

Anaconda虚拟环境的操作1、在cmd或者terminal中输入命令:conda create -n tensorflow python=3.52、激活虚拟环境windows下:activate tensorflowlinux下:source activate tensorflow3、经过第2步,进入了tensorflow虚拟环境中了,所以现在所有的操作将只会影响到这个环...

2018-10-29 16:41:37 3762 2

原创 matlab一些简单语法,文件读取和写入

去除数组某个元素:>>a = [1:10] %生成数组aa =1 2 3 4 5 6 7 8 9 10>> a(5) =[]; %删除数组a中第5个元素>> aa =1 2 3 4 6 7 8 9 10注意:数组的下标是从1开始的。读取文件,txt里面的内容是:6book 4water 3food 7computer 9snack...

2018-10-29 15:24:42 384

原创 分词 | 双向匹配中文分词算法python实现

摘要本次实验内容是基于词典的双向匹配算法的中文分词算法的实现。使用正向和反向最大匹配算法对给定句子进行分词,对得到的结果进行比较,从而决定正确的分词方法。算法描述正向最大匹配算法先设定扫描的窗口大小maxLen(最好是字典最长的单词长度),从左向右取待切分汉语句的maxLen个字符作为匹配字段。查找词典并进行匹配。若匹配成功,则将这个匹配字段作为一个词切分出来,并将窗口向右移动这个单词的长...

2018-10-22 16:36:00 4205 7

原创 分词 | 概率最大中文分词python实现

摘要概率最大分词是分词的其中一种算法,通过选出句子中所有的候选词,计算它们的累计概率,在不同的词语组合中选出累计概率最大的组合作为最终的分词结果。这里使用python进行实现。算法描述首先解释一下累计概率怎么计算:假如待分词的句子为“对外经济技术合作与交流不断扩大。”,候选词可能有“对”、“对外”、“外”、“经济”等。对于每个词的累计概率,等于它原来的概率乘上累计概率最大的左邻词的概率,即P...

2018-10-22 16:21:09 2473 1

转载 多项式回归:正规方程参数θ的推导过程

多变量线性回归代价函数为:其中: 正规方程是通过求解下面的方程来找出使得代价函数最小的参数:设有m个训练实例,每个实例有n个特征,则训练实例集为: 其中表示第i个实例第j个特征。特征参数为:输出变量为:故代价函数为:进行求导,等价于如下的形式:求导公式:其中第一项:第二项: 该矩阵求导为分母布局下的标量/向量形式:...

2018-09-04 19:07:20 1596 2

原创 查找最近元素

查找最近元素

2017-11-19 22:22:35 577 1

原创 求阶乘的最右一位非零数字

求阶乘的最右一位非零数字

2017-11-19 22:11:21 1630

原创 动态规划——青蛙过桥

动态规划——青蛙过桥

2017-11-19 20:23:51 3365 1

原创 动态规划——求数字三角形最优解和最优路径

求数字金字塔最优解和最优路径

2017-11-19 19:21:19 4059 1

原创 动态规划——单调递增最长子序列

动态规划——单调递增最长子序列

2017-10-27 13:43:09 453

原创 动态规划——最大字段和

动态规划——最大字段和

2017-10-27 13:41:12 812

原创 动态规划——租用游艇问题

动态规划——租用游艇问题

2017-10-27 13:38:23 3485

原创 动态规划——编辑距离

动态规划——编辑距离

2017-10-26 21:55:33 3771 2

原创 两个有序序列的中位数

两个有序序列的中位数

2017-10-25 20:47:41 3154

转载 英语停用词(转载)

英语停用词

2017-07-20 11:03:50 1302

原创 mongodb初体验

在终端对mongodb的简单操作

2017-05-13 18:00:19 357

原创 mongodb初体验

关于在终端的mongodb的简单操作

2017-05-13 16:05:05 403

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除