自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 资源 (1)
  • 收藏
  • 关注

原创 bert改进模型梳理

2019-12-17 13:32:29 721

原创 openai-GPT模型

引言一个对文本有效的抽象方法可以减轻NLP对有监督学习的依赖。目前大多数深度学习方法依靠大量的人工标注信息,这限制了在很多领域的应用。此外,即使在可获得相当大的监督语料情况下,以无监督学习的方式学到的表示也可以提供显着的性能提升。到目前为止,最引人注目的证据是广泛使用预训练词嵌入来提高一系列NLP任务的性能。结构OpenAI-GPT提出一种半监督的方式来处理语言理解的任务。使用非监督的预训...

2019-03-16 14:03:15 9695

原创 《机器学习调参》阅读感

机器学习的调参是一门很难说清的东西学问,包括吴恩达在《机器学习调参一书》也并没有指出一条明确的手段,更多的是一种方向。纵观全文,总结一下《机器学习调参》的思路如下:1.数据集的划分在开始进行机器学习调参之前,需要进行数据集的划分。其中作者特别提到了目前机器学习中的一个难点现状,即有标签数据的缺少;即我们在训练过程中训练集的数据分布与实际测试集数据的分布是不一致的。在此,作者举了一个例子,假设...

2019-03-08 19:27:24 442

原创 EMLO词向量

引言 本文提出了一种提取深层次语义特征的词向量的方法,该方法是通过一个在大规模语料库上预训练得到的模型来提取词向量。通过本文方法提取到的词向量效果较好,可用于多种类型的NLP任务。文中采用了一种名为biLM的模型,该模型是一种“双向”的模型。 假设我们有...

2019-03-06 08:57:25 2923

原创 pycharm实用快捷键注释大全(持续更新中)

Ctrl + F1 显示错误描述或警告信息Alt + Enter 快速修正Ctrl + R 替换Ctrl + Shift + F 或者连续2次敲击shift 全局查找{可以在整个项目中查找某个字符串什么的,如查找某个函数名字符串看之前是怎么使用这个函数的}Ctrl + Shift + R 全局替换Alt + Shift + F10 运行模式配置Alt + ...

2019-02-28 09:36:00 2889

原创 使用keras进行文本分类

随着keras被集成到tensorflow的核心代码库,其使用也越来越广泛。本文中将介绍keras进行文本分类的过程。先上一段keras代码,可以看到keras只需要20多行代码就完成了lstm文本分类。其中使用了imdb数据集(链接:https://pan.baidu.com/s/1-zp38W1D-2NoCY5sIuJ5uA提取码:45a8)。from keras.preprocessin...

2019-02-27 16:52:53 1336

原创 微博热门搜索榜爬取

新浪微博的热搜榜网址是http://s.weibo.com/top/summary,总共有50条,如图所示使用BeautifulSoup包,直接上代码:import requestsimport jsonfrom lxml import htmlfrom bs4 import BeautifulSoupetree = html.etreeheaders = {‘User-Agen...

2019-02-13 10:58:38 2458

原创 机器学习中的数据集划分

通常我们把分类错误的样本数占样本总数的比列称为“错误率”(error rate),相应的,1-错误率=精度。我们把学习器在训练集上的误差称为“训练误差”,在新样本上的误差称为“泛化误差”。当学习器把训练样本学得太好了的时候,很可能已经把训练样本自身的一些特点当做了所有潜在样本都具有的一般性质,导致学习器的泛化性能下降,称之为“过拟合”;而对训练样本的一般性质尚未学好,称为“欠拟合”。要评估学习...

2019-01-28 09:02:07 3599

原创 如何使用gitlab上传更新代码?

如何使用gitlab上传更新代码?gitlab提交更新步骤:当在dev分支修改了我们的文件之后,相应的文件会变蓝色:之后点击提交(commit)按钮:会出现如下的界面,点击右下角的commit按钮,这是更新的文件已经准备好上传了,但还未完全更新(就像写入了缓冲区,还未写入磁盘中一样);之后再点击VCS中的git,选中push,则会正式在dev分支中更新文件;对于维护者的操作:...

2019-01-24 11:24:27 5477

原创 TensorflowonSpark环境搭建(3台机器)

HADOOP环境搭建:可以参考这篇文章:https://blog.csdn.net/qq_34256296/article/details/81321024Tips:在搭建的过程中所创建的临时目录需要在hadoop文件夹内,以方便在配置好hadoop环境后通过scp命令分发到其他机器上面。在hadoop集群启动后,通过访问主节点的50070和8088两个端口,可以分别web访问hado...

2019-01-10 13:35:52 5005 2

原创 ssh

在Struts + Spring + Hibernate的组合框架模式中,三者各自的特点都是什么?        Struts 的MVC设计模式可以使我们的逻辑变得很清晰。        Spring 的IOC和AOP可以使我们的产品在最大限度上解藕。        hibernate的当然就是实体对象的持久化了        典型的J2EE三层结构,分为表现层、中间层(业务逻辑层)和数据服务层。...

2019-01-10 09:48:31 117

原创 tensorflow-gpu在linux平台的安装

ubuntu安装:1.安装时不能插着网线,否则安装时会去下载很多的安装包,但url是国外的,导致最终无法安装。2.装好ubuntu后首先要更换国内的源(即apt-get使用的源)    具体更换的方法可以参考链接:https://blog.csdn.net/h8178/article/details/795174433.之后安装anaconda软件:从Anaconda官网(http...

2019-01-10 09:21:49 763

原创 tensorflow在linux平台上的搭建

1.下载并安装Anaconda1.1 下载从Anaconda官网(https://www.continuum.io/downloads)上下载Linux版本(推荐python3.5)1.2 安装cd ~/Downloadsbash Anaconda-4.2.0-Linux-x86_64.sh                      (tips:4.2.0对应python3.5...

2019-01-10 09:20:01 286

原创 tensorflow-gpu在window平台上的搭建

背景tensorflow作为深度学习的利器,广受欢迎。在刚开始做一些基本实验的时候,我们使用的是tensorflow的cpu版本,这个版本安装简单,使用方便,而当数据集较大或是实验复杂时,便需要借助tensorflow-gpu版本加速训练过程。本文以公司配发的小米笔记本为平台,搭建tensorflow-gpu版本。 1. Python 相比于作为一个过渡版本的Python 2.6,...

2019-01-10 09:19:25 217

原创 tensorflow在windows平台上的搭建

一:安装Anaconda和Tensorflow步骤:1:从官方网站下载Anacondahttps://www.anaconda.com/download/ 2:进行软件安装(这个和普通的没什么特别区别)注意一点:3:安装完成Anaconda之后进行环境变量的测试进入到windows中的命令模式:(1)检测anaconda环境是否安装成功:conda --ve...

2019-01-10 09:13:46 2208

原创 haoop集群的网络配置

对于haoop集群的网络配置是一个重要的知识点,在后面它并不会被经常提到,但如果前期没有将这个知识点弄懂,对于后面的学习将是一个很大的障碍。Hadoop集群的搭建中网络有三种方式,即NAT方式,bridge方式,以及host-only方式。现重点将NAT方式别说明如下:NAT方式:此方式使用vmnet8作为虚拟的路由器和外部进行通信,即vmnet8的网关要设置为192.168.230.1,

2017-09-24 13:12:22 573

原创 论centos安装后的网络配置

最近打算系统的学习下linux,遇到了不少的坑,特此分享出来,希望大家能避免。      切入正文,楼主在vm8.0中安装好了centos6.5后突然发现自己的centos无法与宿主机ping通,我的解法是这样的:      由于我的电脑是拨号上网,因此centos使用的是nat方式;如果读者电脑的上网方式是办公室环境,建议使用桥接方式(也可以用nat)。      1.首先查看自己本

2017-08-02 22:19:00 356

原创 ssh

在Struts + Spring + Hibernate的组合框架模式中,三者各自的特点都是什么?        Struts 的MVC设计模式可以使我们的逻辑变得很清晰。        Spring 的IOC和AOP可以使我们的产品在最大限度上解藕。        hibernate的当然就是实体对象的持久化了        典型的J2EE三层结构,分为表现层、中

2017-03-20 21:31:54 570 1

原创 window10下python开发环境的搭建,用于数据处理

最近因为需要做数据处理方面的工作,所以不得不接触到了python。python和linux的兼容性简直完美,拿起来就可以用,但和windows就有点水土不服了。但作为小白一枚,没有办法只能从windows开始。后面看来得要好好学学linux了。废话少说,我在windows下主要使用了eclipse+devpy插件来进行python的开发,这一步的配置就直接省略了,网上太多了。在搭建好环境后,我

2017-03-15 17:31:19 680

原创 R中连接mysql数据库

R语言和mysql就像形影不离的双胞胎,如何在R中连接到mysql数据库?首先要根据自己的数据库版本(版本不配匹,可能连接不上)下载数据库连接驱动,由于我的是在win10平台,因此下载相应的驱动后直接点击下一步安装就ok了。在管理工具中双击ODBC数据源(32位),点击添加,再选择MYSQL ODBC 5.1Driver即可创建mysql用户数据源,注意在配置过程中点击De

2017-02-24 20:19:29 486

转载 eclipse怎么设置字体大小

打开eclipse,找到window点击后在下拉菜单中找到preferences在左边的菜单栏中找到general,appearance在general展开后的第一行,点击展开appearance找到colors and fonts,点击这样就快找到我们要的了看到右边字体一列有很多的选项,我

2016-04-05 21:25:01 537

原创 Android开发环境搭建

由于电脑是64位的机器,所以Java jdk安装的也是64位的(发挥电脑最大性能),因此eclipse也要使用64位的,首先下载64位的eclipse,在下载adt插件。注意adt是没有32位和64位之分的,因此可以通用。具体的安装adt方法如下:       本开发环境为:eclipse + android sdk,步骤说明的顺序,没有特别要求,看个人爱好了步骤说明:1、安装

2016-04-04 13:48:10 224

转载 dijkstra算法

1.dijkstra算法简介Dijkstra算法是由E.W.Dijkstra于1959年提出,又叫迪杰斯特拉算法,它应用了贪心算法模式,是目前公认的最好的求解最短路径的方法。算法解决的是有向图中单个源点到其他顶点的最短路径问题,其主要特点是每次迭代时选择的下一个顶点是标记点之外距离源点最近的顶点。但由于dijkstra算法主要计算从源点到其他所有点的最短路径,所以算法的效率较低。2

2016-03-29 16:22:43 405

转载 javaweb中使用百度地图进行定位

第一种  百度直接上代码:html>head>meta name="viewport" content="initial-scale=1.0, user-scalable=no" />meta http-equiv="Content-Type" content="text/html; charset=gbk" />titl

2016-03-14 15:14:50 8873 2

转载 OnPageChangeListener参数变化详细总结

我们给viewpager设置监听的时候,对于这个地方的几个函数,我总是记不太清楚,今天就好好整理整理。[java] view plain copy vp.setOnPageChangeListener(new OnPageChangeListener() {                    @Override      pu

2016-03-06 17:00:59 1292

原创 道客巴巴免费复制

相信很多人都曾经想在豆丁网、道客巴巴这类网站下载文档来,结果发现不是收费,就是索取积分,最后基本也是没办法下载。  这里分享两个方法。1、在豆丁网、道客巴巴有的文档,其他网站也有可能是有的,可以搜索文档名字,多换几个搜索引擎试一下。2、如果实在不行,可以使用百度快照功能,如下图,一个无法下载的文档,在百度快照中,就可以复制了。剩下的就是自己整理数据了。

2016-02-27 17:06:20 15288

原创 Android开发中关于小米2s手机的调试问题

说到安卓开发,虽然谷歌为我们提供了强大的模拟机,但在做实际的开发时,我们还是要用到真机,毕竟在真机上能够反映出很多在模拟机上看不到的问题。自从我的米2s光荣退休后便成为了我的试验机,但总是问题不断。今天就来说说这些问题。记得去年将自己的小米刷成了mimu7开发版,有段时间自己写的程序一直下不进去,当时一直不懂怎么回事,以为是自己手机不行,每天就拿别人的手机来做开发,也挺麻烦的,不过还好也非常谢

2016-02-26 09:21:32 3196

转载 android中asynctask的应用实例

Android是单线程的,如果要用到异步处理时怎么办啦?这是就可以使用两种方法,AsyncTask和Handler,下面为大家一一介绍。  首先介绍AsyncTask,Android的AsyncTask比Handler更轻量级一些,适用于简单的异步处理。首先明确Android之所以有Handler和AsyncTask,都是为了不阻塞主线程(UI线程),且UI的更新只能在主线程中

2016-02-25 15:06:00 259

原创 百度地图官网中的示例错误

在百度地图开发官网中给出了一段示例,今天照着官网给出的示例,从头到尾按步骤做了一遍流程,但当程序下入手机上时,程序任然不能运行,这时需要多看logcat,其中提示需要android.permission.READ_PHONE_STATE的权限,但官网中并没有出现这一权限的要求,因此提醒大家在加入权限时一定要加这一权限,防止程序的崩溃。

2016-02-24 16:55:48 574

原创 安卓控件的监听功能实现

在安卓中我们实现按钮等控件的功能是通过监听的方式来实现,而具体的监听方法经常用到的有onclick方法与setOnClickListener方法,而具体如何使用有待慢慢摸索。今天具体介绍他们之间的用法,毕竟在编程入门中更多的是拿来主义。以button按钮为例,     在XML布局文件中设置Button的属性:  android:onClick="yourMethodName"

2016-02-24 15:57:20 2127

原创 logcat的显示问题

开工第一天,打开eclipse,突然发现logcat在运行了一个程序之后不再显示了,这时先拔下真机的数据线,但logcat还是没有反应,之后又没办法重启了eclipse。当第二次打开eclipse,下载程序到手机上时,logcat又可以重新显示了,真的是让人十分的无语,也许我们的电脑软件就是这样,时不时会抽风一下,下次遇到这种问题大可以重启eclipse,或重新拔插数据线。

2016-02-24 14:48:14 335

原创 小米手机刷机教程

由于之前使用的一直是小米手机的MIUI开发版本,从v5到v6,虽然开发板的花样挺多,开始小编也挺喜欢的,但到了v7以后小米2s卡的不行不行的,总觉得需要做些什么改进改进。手机卡顿,无非就是运行内存不足,咱们可以尝试换一个稳定版的miui v7系统,系统就会运行的流畅一些。老实说,之前对于小米手机的刷机是一窍不通,之前也刷过其他的手机,但用的是qq管家或360管家自带的那种傻瓜式刷机软件,就是不

2016-01-31 14:41:01 1147

原创 linux系统的安装

上节中说到了windows系统的安装,这节为大家讲解linux系统的安装,为什么要安装linux系统,如果只是平常的办公的话,windows就完全可以胜任了,但稍微要接触到学术上的问题,就需要linux系统来操作了,毕竟这是目前使用率增长最快的系统,比如在服务器端大部分都使用的linux系统,如果你问我为什么,我建议你可以先安装来使用一下,之后给出你自己的答案。        老规矩,我们仍然

2016-01-30 19:08:14 422

原创 windows7系统的安装

快过年了回到家里,发现很多亲戚朋友因为windows系统使用的比较久,经常出现看视频卡顿,玩游戏不顺畅以及黑屏的现象出现。在这些情况下,重装系统就成为一个比较简便的“万能”解决方法。很多人知道我是计算机学院毕业的,这种情况下自然不少人来找我装系统,今天我就为大家科普一下,教大家如何正确的安装系统。好了,在装系统前你需要明白你电脑的硬件配置能够匹配什么样的系统,在这里我举Windows为例,li

2016-01-30 18:29:41 517

原创 java基础学习

Java变量的命名Java变量命名其实也有很多要注意的地方,有字母,数字,下划线,和$,建议采用驼峰命名法来规范命名,以便他人能快速看懂你的代码,达到见名知意的效果。Java的命名中还可以使用中文命名,这点相比c有了很大的进步,但还是不提倡使用。

2016-01-21 19:55:18 413 4

转载 php

几款常用PHP开发工具几款常用PHP开发工具 最近想好好研究一下PHP开发,所以搜罗了一下。找了这么几款开发工具和大家共享。 1、EditPlus 一套功能强大,可取代记事本的文字编辑器,拥有无限制的Undo/Redo、英文拼字检查、自动换行、列数标记、搜寻取代、同时编辑多文件、全屏幕浏览功能。而它还有一个好用的功能,就是它有监视剪贴簿的功能,能够同步于剪贴

2016-01-17 20:05:05 389

话题检测及跟踪评价数据集

搜狗话题检测的数据集,大约1000条数据的链接,需要根据链接自己去爬取数据;每个链接后面附有相应的话题,话题比较细致,适合用来做实验或毕业设计;

2019-01-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除