自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(178)
  • 资源 (73)
  • 问答 (2)

原创 深度学习与自然语言处理(NLP)学习

笔者是NLP方向研二在读,本博是记录自己深度学习和自然语言处理学习的点滴(主要是资料汇总),不定期更新,希望能帮到你~11.百闻不如一码!手把手教你用Python搭一个Transformer2.从ReLU到GELU,一文概览神经网络的激活函数...

2020-04-14 15:43:52 169

原创 实体标注、序列标注工具-BIO方式

笔者研究方向为NLP知识抽取,做实体抽取实验过程中需要对训练数据进行标注。我先使用jieba分词对原文本进行分词和pos词性标注,然后基于pos词性标注抽取出文本中的公司名、证券、基金名称(这部分也可以使用正则方法)等,保存到word_dict.txt中作为词典,然后基于改词典对原文本中进行的数据进行标注。word_dict.txt如下:INT与BON文本对应的标签。占位词 NONE,这一...

2019-12-16 14:10:16 1595 9

原创 实体抽取-关系抽取-事件抽取与知识图谱学习资源汇总

1.关系抽取之远程监督算法综述该文章介绍了PCNN、基于远程监督的关系抽取、多实例学习等。关系抽取之远程监督算法

2019-11-28 10:08:48 1919 1

原创 找出一个字符串中所有大于1的回文串数量

找出一个字符串中所有大于1的回文串数量,2021网易算法岗笔试class Solution(): ''' 找出一个字符串中所有大于1的回文串数量 ''' def subString(self, s): cnt = 0 for x in range(len(s)): for i in range(len(s) - x): if s[i:i+x+1] == s[i:i+x+1][::-1]

2020-09-12 16:42:59 32

原创 求满足条件的最长字符串的长度

**题目:**给定一个字符串,青返回满足以下条件下最长字符串的长度:‘a’,‘b’,‘c’,‘x’,‘y’,'z’都恰好出现了偶数次(0也是偶数)。输入:一个长度大于1的字符串输出:一个整数,满足条件的最长字符串长度'''给定一个字符串,青返回满足以下条件下最长字符串的长度:'a','b','c','x','y','z'都恰好出现了偶数次(0也是偶数)输入:一个长度大于1的字符串输出:一个整数,满足条件的最长字符串长度'''class Solution(): def sol

2020-09-12 16:37:18 159

原创 Python正则表达式过滤文本

记录一下def delete_tag(s): s = re.sub('\{IMG:.?.?.?\}', '', s) # 图片 s = re.sub(re.compile(r'[a-zA-Z]+://[^\s]+'), '', s) # 网址 s = re.sub(re.compile('<.*?>'), '', s) # 网页标签 s = re.sub(re.compile('&[a-zA-Z]+;?'), ' ', s) # 网页标签 s =

2020-09-11 11:00:56 25

原创 给定一个序列求指定位数的排列组合数

题目:求1到p(p<10)个数中取k(1<k<p)个全部可能的排列。样例输入:3 2样例输出:[1,2],[1,3],[2,1],[2,3],[3,1],[3,2],方法:回溯+深度优先搜索class Solution: def numofSum3(self,candidates, target)->int: #回溯组合 result=[] tmp=[] candidates.sort()

2020-08-27 15:55:52 124

原创 2021NLP算法岗面试笔试总结-持续更新

1.word2vec介绍2.word2vec负采样与层次化softmax原理负采样:单词出现频率的越高,它被采样保留的概率越来越小参考:理解word2vec、负采样、层次化softmax3.CNN中池化层的作用1、特征不变性,空间不变性,池化操作使模型更加关注是否存在某些特征而不是特征具体的位置,可以看做是一种很强的先验,是特征学习包含某种程度自由度,能容忍一些特征微小的位移。2、特征降维。类似于做了维度约减,使模型可以抽取更广泛围的特征,减小了下一层输入大小,进而减小计算量和参数个数。3、在

2020-08-26 12:22:08 94

原创 根据二叉树的前序和后续遍历求二叉树的叶子节点数

题目描述:根据二叉树的前序和后续遍历求二叉树的叶子节点数输入:前序[‘A’,‘B’,‘C’,‘D’,‘E’,‘F’,‘G’]后续[‘C’,‘B’,‘D’,‘A’,‘E’,‘G’,‘F’]输出:4首先根据前序和后续遍历恢复二叉树,然后再统计叶子结点数量。Python实现:#!/usr/bin/python# -*- coding: UTF-8 -*-class TreeNode(): def __init__(self,val,left=None,right=None):

2020-08-16 14:02:11 310 8

原创 在字符串尾部/头部加入最少字符使字符串成为回文字符串

2021某易笔试题:给定一个字符串,判断其是否为回文串,若不是回文串的话在该串头部添加任意字符使其成为回文串。本文参考了[1]并实现了两种方式,一种为在字符串头部添加任意字符,另一种为在字符串尾部添加任意字符。1.在字符串头部添加任意字符,使其成为回文串。package com.cd.utils;import java.util.Scanner; public class Demo { public static void main(String[] args) { Scanner

2020-08-13 15:21:56 139

原创 机器学习算法面试笔试整理

1.逻辑回归逻辑回归面试总结

2020-07-27 18:53:48 57

原创 python向json文件中追加内容

我们常常会遇到这样的json文件:[{"id": 4, "text": "LOC", "background_color": "#7c20e0", "text_color": "#ffffff"}, {"id": 5, "text": "MISC", "background_color": "#fbb028", "text_color": "#000000"}, {"id": 6, "text": "ORG", "background_color": "#e6d176", "text_colo

2020-07-01 15:30:18 867

原创 TensorBoard案例

本文构建了Tensorflow中tensorbord的使用案例,通过手写数字识别(MNIST)数据集创建了一个简单的神经网络,本文仅示例tensorbord在构建网络时的应用,具体的可视化过程网上已有不错的讲解,如tensorboard使用讲解专注于机器学习、深度学习、自然语言处理的公众号,欢迎来撩~以下是本文的案例:关键的地方代码中已注释,不再赘述~# coding: utf-8# In[1]:import tensorflow as tffrom tensorflow.exampl

2020-06-27 15:47:51 97

原创 Latex排版公式时编号右对齐

Latex排版公式时让该公式对应的编号右对齐,如下例:直接使用**\begin{equation} \end{equation}**就好,公式里面不用手动写编号,编译后会自动生成。\begin{equation}y=\dfrac{1}{1+e^{-H_{ed}}}\end{equation}效果:...

2020-06-14 15:47:45 1130

原创 selenium爬取数据打开浏览器新的标签页

如何利用webdriver打开多个标签页和链接呢?经实践,网上流传的传入“ctrl+t的按键事件”方法针对谷歌浏览器并不适用。实践证明以下方式可以正常打开谷歌浏览器新的标签页。browser.execute_script("window.open('" + url + "');")完整例子:import timefrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium import webdriver'''爬取

2020-06-12 23:18:11 215

原创 什么是语言模型?如何判断模型是不是语言模型

本文假定读者了解word2vec、emlo、BERT等模型。那么什么是语言模型呢?或者说如何判断一个模型是不是语言模型呢?首先我们来看一下语言模型(LM)的两个目标:(1)LM的目的是为一个句子或词序列赋予一个概率。(2)LM预测下一个词的概率,也就是说它预测下面最有可能出现的一个词。任何一个具有上面任务的模型称为语言模型。如word2vec通过当前词预测上下文词,或通过上下文词曲预测当前的目标词。其他语言模型不再追述,有兴趣的可以自行查阅资料。参考:python自然语言处理...

2020-06-01 17:14:07 134

原创 对BERT分词之后的文本序列进行BIO标注

先记录一下,有时间再写具体过程。关注“编程ABC”,每天进步一点点~待标注文本(text.txt):河南宏光正商置业有限公司2019年非公开发行公司债券(第一期)(品种二)定于2019年12月3日起在本所综合协议交易平台进行转让,现将有关事项通知如下:河南宏光正商置业有限公司2019年非公开发行公司债券(第一期)(品种二)证券代码“114613”,证券简称“19正商02”,发行总额7.5亿元,票面利率7.2%,债券期限3年,附第1年末和第2年末发行人调整票面利率选择权及投资者回售选择权。深圳证券交易

2020-05-08 17:55:22 556 1

原创 找出一段文本中所有长度大于5的回文串

今儿朋友阿里三面,有这么一道题。题目描述:打印出一段文本中的所有长度大于5的回文串,请用你熟悉的语言编码。先给出Java语言的,后面又时间会给出python的版本。Java实现:package com.cd.utils;import java.util.ArrayList;import java.util.List;public class Test { public ...

2020-04-12 16:36:36 75

原创 BERT预训练模型字向量提取工具--使用BERT编码句子

本文将介绍两个使用BERT编码句子(从BERT中提取向量)的例子。(1)BERT预训练模型字向量提取工具本工具直接读取BERT预训练模型,从中提取样本文件中所有使用到字向量,保存成向量文件,为后续模型提供embdding。本工具直接读取预训练模型,不需要其它的依赖,同时把样本中所有 出现的字符对应的字向量全部提取,后续的模型可以非常快速进行embddinggithub完整源码#!/usr...

2020-04-12 10:41:15 1034

原创 bert分词工具-使用Bert自带的WordPiece分词工具将文本分割成单字

笔者不久前发布过一个[中文分字工具](本文称之为version1.0)(https://blog.csdn.net/broccoli2/article/details/104952639),该工具是将所有的字符单独分离出来,并以空格隔开。笔者使用该工具分字之后在实体分类任务上的效果很差。原因可能有下.时间数据经version1.0处理之后如下:原数据:2020年4月2日version1.0处...

2020-04-02 10:16:21 897

原创 中文字符分字处理工具

中文字符分字处理工具,将字符进行分字处理,字符与字符以空格隔开,如:我是一名小学生 处理后:我 是 一 名 小 学 生input:北京时间3月18日,布鲁克林篮网队今天宣布球队里有4名球员的新冠病毒检测结果呈阳性。篮网队在声明里没有透露这4名球员的名字,但是指出其中1名球员出现了新冠病毒的症状,另外3名球员无症状。与此同时,篮网队表示他们正在通知任何与这些球员接触过的人,包括最近的对手。...

2020-03-18 20:24:20 155

原创 论文浅尝-Improving Neural Fine-Grained Entity Typing with Knowledge Attention

这是一篇来自清华2018年的paper。文章做的是基于知识注意力机制的细粒度实体分类任务(Fine-Grained Entity Typing)。任务介绍:给定一个句子,其中包含一个实体和它的上下文,以及一组实体类型,我们的模型旨在预测所提到的实体的每种类型的概率。**提出问题:**大多数现有的方法通常分别从实体提及和上下文单词中提取特征来进行实体类型分类。这些方法不能对实体提及和上下文词...

2020-03-14 19:38:44 291

原创 Java教师教学评价系统

请移步:Java教学评价系统

2020-02-23 14:30:13 1100 1

原创 论文阅读-Event Detection without Triggers

Event Detection without Triggers(腾讯、NAACL2019、源码&无数据集源码)原文链接:原文链接(1)背景事件检测(Event detection)的目标是检测文本中是否含有事件并对其进行分类。传统的事件检测任务往往首先识别文本中的事件触发词(Event trigger),然后对触发词进行分类。这类任务需要预定义触发词字典并耗费大量时间对触发词进行标...

2020-01-08 14:17:26 523

原创 Event Detection with Trigger-Aware Lattice Neural Network(论文解读)

本文针对事件抽取任务中的触发词识别和触发词分类子任务提出了可以充分利用字级别和词级别语义信息的模型Trigger-Aware Lattice Neural Network(TLNN),在ACE2005和KBP2017数据集上取得了state-of-art的效果。本文收录在EMNLP2019源码:github 原文:原文链接缺少自然分隔符的语言(如中文)在事件抽取任务上存在以下问题:① 基于词...

2020-01-07 16:56:45 490

原创 金融领域文档级别事件抽取-Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extract

该论文来自EMNLP2019、清华&微软研究院、源码&数据集【1】已开源github:Doc2EDAGpaper地址:paper原文金融领域数据有以下两种特征:① 事件元素分散(Arguments-scattering):指事件论元可能在不同的句子(Sentence)中。② 多事件(Muti-event):指一个文档中可能包含多个事件。由于Sentence-level级别...

2020-01-07 13:13:37 1344

原创 美甲网站

基于Javaweb的美甲网站,美甲商城。数据库使用了MySQL。需要代码的请加QQ1003589522联系,加QQ时请备注:需要美甲网站源码以下是系统截图:![在这里插入图片描述](https://img-blog.csdnimg.cn/20190612184829930.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGV...

2020-01-03 13:51:59 1342

原创 python+selenium爬取链家网房源信息并保存至csv

python+selenium爬取链家网房源信息并保存至csv抓取的信息有:房源’, ‘详细信息’, ‘价格’,‘楼层’, '有无电梯import csvfrom selenium import webdriverimport timefrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support i...

2019-12-27 20:21:13 585

原创 Java自动排课

1.2 系统开发环境本系统的开发工具主要是在windows 系统下采用MyEclipse 和Mysql。MyEclipse 企业级工作平台(MyEclipse Enterprise Workbench ,简称MyEclipse)是对EclipseIDE的扩展,结合它我们可以在JavaEE和数据库的开发、发布及应用程序服务器的整合方面能极大地提高工作效率。MyEclipse是功能丰富的JavaE...

2019-12-20 13:37:09 4068 3

转载 管道式实体关系抽取模型解读

前言bert模型是谷歌2018年10月底公布的,反响巨大,效果不错,在各大比赛上面出类...

2019-12-15 18:30:28 269

原创 python+selenium多线程与多进程爬虫

使用python+selenium抓取深圳证券交易所本所公告数据,刚开始是用单进程爬取的,最近将代码修改了一下,分别用多进程和多线程进行抓取,速度非常快。如果对selenium不了解的请移步别的地方学习一下。多进程爬取# coding=utf-8'''多进程抓取深圳证券交易所本所公告数据标题和公告内容写入了不同的csv文件里Author:西兰Date:2019-11-30'''...

2019-12-01 11:37:26 1748

原创 python读写txt、csv、json

先写这些,有时间再加。import csv'''Description:文件读写工具Author:西兰Date:2019-11-30'''class util(object): ''' 以追加形式写入txt文件,带换行 ''' def write_to_txt(self,filename, line): with open(file...

2019-11-30 15:51:02 93

原创 python爬虫-selenium爬取链家网房源信息

使用selenium抓取链家网房源信息,含分页处理。源码如下,详细请看注释:# coding=utf-8from selenium import webdriverimport timefrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support import expected_conditions...

2019-11-17 12:26:33 831

原创 Java读写txt文件案例-统计学生名单

Java读写txt文件案例-统计学生名单,具体应用请看代码中的实现原理。package shuzu;import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.File;import java.io.FileInputStream;import java.io.FileOutputStream;...

2019-11-04 19:44:49 365

原创 随机切分深度学习训练集、验证集、测试集

目的:将1.6万条数据随机切分成训练集、开发集、测试集。参考了python随机读取txt文档某一行的源码,源码如下:#coding=utf-8#! /usr/bin/pythonimport randomimport linecachedef hello():count = len(open('hello.txt','rU').readlines())#获取行数hellonum=r...

2019-10-14 18:48:03 249

原创 什么是实体对齐、实体消歧、属性对齐?

什么是实体对齐、实体消歧?实体对齐旨在判断两个或者多个不同信息来源的实体是否为指向z真实世界中同一个对象。如果多个实体表征同一个对象,则在这些实体之间构建对齐关系,同时对实体包含的信息进行融合和聚集。实体消歧:根据上下文信息实现消除一词多义的现象。参考:实体和属性对齐方法的研究与实现(硕士论文)http://cdmd.cnki.com.cn/Article/CDMD-10007-101881...

2019-10-13 11:41:19 3243

原创 结巴分词----去停用词

目前的课题需要用结巴分词处理一下数据,其中要去掉其中的停用词,以下是代码:import jiebaimport osimport pymysqldef fun(filepath): # 遍历文件夹中的所有文件,返回文件list arr = [] for root, dirs, files in os.walk(filepath): for fn in ...

2019-09-16 18:43:37 2009

原创 c++生成随机数

C++生成随机数源码如下:#include<iostream>#include<cstdlib>using namespace std;void gennum(int n, int base) { srand(0); for (int i=0; i<n; i++) cout<<rand()%20<<" ";}int mai...

2019-07-22 14:57:58 218

转载 Java 最常见 200+ 面试题全解析

版权声明:本文为博主原创文章,...

2019-07-02 11:46:20 277

原创 android小工具--实时获取麦克风声音输入

android小工具-实时获取麦克风声音下载链接:点我下载

2019-06-20 16:07:52 1021

SSM招聘网站.txt

基于SSM的招聘网站,数据库为MySQL,毕业设计,内含url。基于SSM的招聘网站,数据库为MySQL,毕业设计,内含url。

2020-06-15

自行车租赁系统.zip

Javaweb自行车租赁系统,本人毕业设计,含SQL文件。servlet+JSP+Mysql,Javaweb自行车租赁系统

2020-04-12

springMVC笔记.pdf

网上某平台springmvc课程学习笔记整理、从入门让你详细了解springmvc的开发,小白看的懂

2020-04-04

Mybatis笔记 .doc

mybatis学习整理笔记,很详细,小白入门形式整理。

2020-04-04

SSM招聘网站.zip

基于spring、springmvc、mybatis、mysql的Javaweb项目,招聘网站,可用作毕业设计

2020-01-03

DEV C++的安装.rar

DEV C++安装包

2019-07-05

android小工具-实时获取麦克风声音.zip

android工具实时获取麦克风输入。内含apk文件。android工具实时获取麦克风输入。内含apk文件

2019-06-20

jquery.jBox-2.3.min

jquery.jBox-2.3.min.jsjquery.jBox-2.3.minjquery.jBox-2.3.minjquery.jBox-2.3.min

2018-06-25

java文件上传下载

Springmvc+jsp处理文件上传下载,,,简单实用,Springmvc+jsp处理文件上传下载,,,简单实用,可以直接把代码拷贝到你的项目里使用

2018-04-04

2015传智java33期全套视屏教程

2015传智java33期全套视屏教程,,永久有效,包括就业班+基础班,解压无需密码

2018-02-28

ssm-crud.zip

完整的Spring+springmvc+mybatis+maven整合案例,实现了增删改差和分页

2017-11-24

Maven的配置及使用

Maven的配置及使用,Maven的配置及使用Maven的配置及使用Maven的配置及使用Maven的配置及使用Maven的配置及使用Maven的配置及使用

2017-11-08

Git常用命令总结

Git常用命令总结,,Git常用命令总结Git常用命令总结Git常用命令总结

2017-10-12

js日历控件优化

js日历控件优化,含时分秒,年月日,很好用,,js日历控件优化,含时分秒,年月日,很好用,,js日历控件优化,含时分秒,年月日,很好用,,

2017-09-05

echarts.js

echarts3.6.2源码

2017-08-13

http协议资源

http协议学习资源,含ppt和pdf文件

2017-08-11

js-day03.rar

JqueryAPI练习综合,含选择器、事件、函数使用等等

2017-08-11

Mongodb.chm

Mongodb.chm使用手册

2017-08-10

局域网文件和文本传输工具(C#源码)

局域网文件和文本传输工具(C#源码)

2017-08-10

jQuery加强.ppt

jQuery加强.ppt

2017-08-09

jquery-1.8.2

jquery-1.8.2,jquery-1.8.2

2017-08-06

poi所需jar

poi所需jar包,解决Excel的导入导出问题

2017-08-05

svn使用教程

svn使用教程,从安装到配置再到企业级应用,很详细

2017-07-30

json.js.ZIP

json.js工具,对象相互转换的工具

2017-07-26

struts2-json-plugin-2.3.16.3.jar

struts2-json-plugin-2.3.16.3.jar

2017-07-24

mongodb、redis全套视频教程

mongodb、redis全套视频教程,非常详细

2017-07-22

《软件工程》课程设计报告模板

《软件工程》课程设计报告模板,经典版,内容全面详细

2017-07-12

ScreenToGif 2.2

gif图片生成工具

2017-07-12

Tomcat_Servlet&Jsp_API文档

Tomcat_Servlet&Jsp_API中文文档,很详细,好用

2017-07-12

国内B2C和C2C电商盈利模式对比分析

国内B2C和C2C电商盈利模式对比分析论文报告

2017-07-12

Mybatis笔记

本人整理的xx播客培训课程里的mybatis课程笔记,包含基础知识点,代码截图,分模块整理,含spring整合mybatis

2017-07-12

计算机毕设_学生宿舍管理系统的设计与实现

毕业设计--学生宿舍管理系统,含开题报告,设计论文,源代码等等

2017-07-12

springmvc_mybatis1208

最新spring+springMVC+mybatis整合案例,,对商品的增删改查,整合了json、Ajax、jsp、javascript、jQuery等等

2017-07-07

JSTL所需jar包

JSTL所需jar包,包含jstl.jar和standard.jar,,JSTL所需jar包,包含jstl.jar和standard.jar

2017-06-19

BBS论坛留言

BBS论坛留言板,改进版。BBS论坛留言板,改进版。BBS论坛留言板,改进版。

2017-06-19

基于struts2的宿舍管理系统

基于struts2+mysql+jsp+javaScript+css等的完整毕设宿舍管理系统,项目完整,可做毕业设计。

2017-06-15

网上书店系统数据流图

网上书店系统数据流图,网上书店系统数据流图,网上书店系统数据流图网上书店系统数据流图

2017-06-15

测试用例模板

测试用例模板(经典)

2017-06-15

bbs论坛留言版

jsp+servlet+mysql实现的bbs论坛留言实例。

2017-06-12

学生信息管理系统

C++实现的学生信息管理系统,实现了增删改查等功能,有界面

2017-06-04

空空如也
提示
确定要删除当前文章?
取消 删除