自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

摸金校尉的博客

帮助值得帮助的人

  • 博客(14)
  • 资源 (1)
  • 收藏
  • 关注

原创 预训练词向量中文维基百科,英文斯坦福glove预训练的词向量下载

中文预训练词向量——基于中文维基百科语料训练英文预训练词向量——斯坦福glove预训练的词向量百度云分享:https://pan.baidu.com/s/1UpZeuqlNMl6XtTB5la53Xw提取码: afhh 维基百科词向量 sgns.wiki.char.bz2解压后文件后缀名是.char, 可以通过一些方法得到.txt结尾的文件,有35万多个字...

2019-05-06 11:07:18 10662 3

原创 Keras的imdb和MNIST数据集无法下载问题解决

keras框架为我们提供了一些常用的内置数据集。比如,图像识别领域的手写识别MNIST数据集、文本分类领域的电影影评imdb数据集等等。这些数据库可以用一条代码就可以调用:from keras.datasets import mnist​from keras.datasets import imdb(x_train, y_train), (x_test, y_test)...

2019-05-05 14:33:35 9893 35

转载 两个线程同时执行i++100次

i++这种操作并不是原子性的, 实际上它的操作是首先从内存中取出数据放在cpu寄存器中进行计算, 然后再将计算好的结果返回到内存中。转载:https://blog.csdn.net/qq_41594146/article/details/87433065可能的结果:最小为2,最大为200最小为2线程执行过程A线程和B线程都是第一次执行i++,cpu1和cpu2寄存...

2019-05-31 23:25:49 2958 1

原创 git学习window安装和使用

Git是一个分布式版本控制系统,让程序员团队能够协作开发项目。便于程序员管理代码,更改版本,修改代码提交,团队协作必须掌握的技能。1、git和svn对比:引用:https://blog.csdn.net/hpu11/article/details/52842233SVN是集中式代码版本控制系统,而Git是分布式代码版本控制系统集中式版本控制系统:版本库集中存放在中央服务器,编程...

2019-05-29 14:17:41 223

转载 【自然语言处理】知识图谱简介

知识图谱的由来 计算机一直面临着这样的困境——无法获取网络文本的语义信息。为了让机器能够理解文本背后的含义,我们需要对可描述的事物(实体)进行建模,填充它的属性,拓展它和其他事物的联系,即,构建机器的先验知识。Google为了提升搜索引擎返回的答案质量和用户查询的效率,于2012年5月16日发布了知识图谱(Knowledge Graph)。有知识图谱作为辅助,搜索引擎能够洞...

2019-05-11 09:55:04 3159

原创 word2vec自训练词向量(代码+注释+训练过程和结果)

word2vec代码(中文英文都可以训练)import collectionsimport mathimport randomimport zipfileimport numpy as npfrom six.moves import xrangeimport tensorflow as tfdef read_data(filename): with zipfile....

2019-05-06 14:59:50 9127 14

原创 语义相似度公开数据集STS、MSRP、SICK 介绍和下载

MSRP、STS、SICK三个句子相似度计算的公开数据集(预处理后便于使用)下载地址百度云:https://pan.baidu.com/s/1y6GoUKfpXKFzDAqpx9k8hQ 提取码: yh6m1、MSRP数据集 Microsoft Research Paraphrase Corpus官方下载网址:https://www.microsoft.com/e...

2019-05-06 09:43:19 15587 15

原创 keras CNN lenet-5和LSTM实现MNIST手写数字识别(代码注释详解)

MNIST手写数字识别数据集(图像识别)数据集包含10个数字的60,000个28x28灰度图像,以及10,000个图像的测试集。如果MNIST数据集无法下载,详见本篇博客提供下载和使用:https://blog.csdn.net/sinat_41144773/article/details/89843688代码实现(CNN卷积、循环神经网络RNN 注释切换)from ...

2019-05-05 15:15:30 3034

原创 keras 实现reuters路透社新闻多分类

路透社reuters话题分类 来自路透社的11,228条新闻数据集标有46个主题。与IMDB数据集一样,每条线都被编码为一系列字索引。reuters数据集无法下载,详见本篇博客提供下载和使用:https://blog.csdn.net/sinat_41144773/article/details/89843688代码实现from keras.datasets...

2019-05-05 15:06:59 1579 3

原创 keras LSTM实现imdb电影评论文本二分类

keras 实现IMDB电影评论情绪分类 数据集来自IMDB的2.5万部电影评论,以情绪(正面/负面)标记。评论已被预处理,并且每个评论被编码为一系列词索引(整数)。为了方便起见,词汇通过数据集中的整体频率进行索引,例如整数“3”对数据中第三个最频繁的词进行编码。这允许快速过滤操作,例如:“只考虑前10000个最常用的词,但是排除前20个最常见的词”。作为惯例,“0”不代表特定的...

2019-05-05 14:47:45 3936

原创 excel密码破解软件Excel Password Unlocker下载和使用技巧(亲测有效!)

Excel Password Unlocker 5.0 汉化版是专为恢复丢失的 Microsoft Excel 密码设计的一个易于使用的工具。每秒可尝试2万多个密码。软件授权:免费软件 软件语言:简体中文 软件大小:1.5 MB 系统支持:Winxp / vista / win7 / win8.1 版本:5.0 支...

2019-05-03 19:42:05 11300 5

原创 公司管理系统(0.5版)基于SSM框架项目源码分享

这版公司管理系统主要包括三个部门:人事部、项目部、财务部业务功能:登录注册、分权限登录 增删改查:用户信息、项目申请送审、财务统计 生成财务报表(上传报表插件)项目github地址:https://github.com/cpthree/Company-Mange-System/tree/master项目的百度云分享链接: https://pan.baidu.com/s/1Nj...

2019-05-03 18:52:43 3701 7

转载 Java线程池ExecutorService介绍

普通new Thread线程(未用线程池)的弊端每次都要new Thread新建对象,性能差。 线程缺乏统一管理,不断的新建线程,占用过多的系统资源,内存溢出。线程池的优点:重用存在的线程,减少对象创建、消亡的开销,性能佳。 可有效控制最大并发线程数,提高系统资源的使用率,同时避免过多资源竞争,避免堵塞。 提供定时执行、定期执行、单线程、并发数控制等功能。  四种常用的线程...

2019-05-02 13:36:11 176

原创 栈内存和堆内存Java(详细实例讲解)

定义栈内存:存放基本类型的变量、对象的引用(引用变量)。(如何回收?) 在一段代码块中定义一个变量时,java就在栈中为这个变量分配内存空间:当超过变量的作用域后,java会自动释放掉为该变量分配的内存空间,该内存空间可以立刻被另作他用。堆内存:存放new创建的对象和数组。(GC垃圾回收)GC垃圾回收:https://blog.csdn.net/sinat_4114477...

2019-05-02 10:29:19 2081

UltraVideoSplitterPortable 视频分割工具.zip

视频分割工具 UltraVideoSplitterPortable 绿色免安装版下载 本人经常使用

2019-05-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除