自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 QA:基于BM25多篇文档中抽取相关问题的答案

答案句抽取1)实现特定问句对应的答案句抽取(在相关文档中抽取包含答案的句子)如:问题句:The complexity of problems often depends on what?包含答案的文档:<Context ID=1-31>This motivates the concept of a problem being hard for a complex...

2019-07-24 10:49:29 656

原创 neo4j-import导入由excel数据生成的csv文件

百度网盘链接:https://pan.baidu.com/s/1i-4hhqpcXuCG4YWU8jdAPg提取码:8y3n智慧工业云服务企业名录2019-5-21保存了沈阳地区部分企业信息以下皆是从上面excel中提取的信息,A.csv为分区结点,C.csv为行业结点,F.csv为法人结点,J.csv为经营结点,Q.csv为公司结点Q2A为公司与分区关系,Q2C为公司与行...

2019-07-16 14:33:37 4295

原创 python 常用函数的记录

(常更)1、enumerate:将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。2、keras.preprocessing.sequence.pad_sequences(sequences,maxlen=None,dtype='int32',padding='pre',truncating='pre', value=0....

2019-07-10 09:07:44 136

原创 Python 正则表达式

常用的正则参考入门(初级篇)“+”代表是字符重复一次或多次。但是我们没有细说这个多次到底是多少次。所以它会尽可能“贪婪”地多给我们匹配字符,加了一个“?”我们就将贪婪的“+”改成了懒惰的“+”。这对于[abc]+,\w*之类的同样适用。元字符 说明 . 代表任意字符 | 逻辑或操作符 [ ] 匹配内部的任一字符或子表达式 [^] 对字符...

2019-07-08 14:04:03 101

原创 正向逆向最大匹配的中文分词

实验语料:人民日报数据、词典由训练语料生成 puk_training.txt:训练语料puk_training_small.txt:训练语料(小)pku_test.txt : 测试语料pku_test_gold.txt:参考答案1、最大匹配法:最大匹配是指以词典为依据,取词典中最长单词为第一个次取字数量的扫描串,在词典中进行扫描(为提升扫描效率...

2019-06-28 16:40:18 621

原创 python CRF中文分词(crf++工具)

实验语料:人民日报数据、词典由训练语料生成puk_training.txt:训练语料puk_training_small.txt:训练语料(小)pku_test.txt : 测试语料pku_test_gold.txt:参考答案crf++工具链接:https://pan.baidu.com/s/1H7ZaifX0lvmfIpG74tLXOA提取码:2beq条件随机场(...

2019-06-28 16:24:20 7421 1

原创 neo4j修改密码

浏览器中打开后在neo4j命令行中输入: :server change-password键入原密码及新密码,即可修改

2019-06-14 15:01:28 1588

原创 The kernel has died, and the automatic restart has failed

首先排除版本的问题:conda upgrade notebookconda upgrade jupyter结果并没有解决这个问题,试试conda install -c conda-forge prompt_toolkit

2019-06-13 21:15:57 927

原创 文本处理

import re#处理后的文本'''第一行原句........<e1>实体A<\e1>...<e2>实体B<\e2>.....第二行 关系 (语序)第三行 content第四行 空处理后 (按语序)实体A 实体B 关系 (去掉标签)的句子'''store = open('../store .txt','a')#读取文...

2019-05-21 11:26:46 142

原创 使用Keras中embedding的词嵌入的记录

参考了MXuDong博主的博文:https://blog.csdn.net/qq_33472765/article/details/86561245kera的embeding层设置初始值的两种方式:1、使用weights参数指明embedding初始值2、使用embeddings_initializer=keras.initializers.Constant(词向量)如果同时传...

2019-05-15 09:44:33 677

原创 Keras网络可视化方法-问题及解决方法windows

1、Failed to import pydot. You must installpydot打开Anaconda Prompt输入conda installpydot命令重启你使用的工具(pycharm、Jupyter等等)2、OSError: `pydot` failed to call GraphViz.Please install GraphVizgraphviz在...

2019-05-13 18:54:48 159

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除