- 博客(11)
- 收藏
- 关注
原创 QA:基于BM25多篇文档中抽取相关问题的答案
答案句抽取1)实现特定问句对应的答案句抽取(在相关文档中抽取包含答案的句子)如:问题句:The complexity of problems often depends on what?包含答案的文档:<Context ID=1-31>This motivates the concept of a problem being hard for a complex...
2019-07-24 10:49:29 675
原创 neo4j-import导入由excel数据生成的csv文件
百度网盘链接:https://pan.baidu.com/s/1i-4hhqpcXuCG4YWU8jdAPg提取码:8y3n智慧工业云服务企业名录2019-5-21保存了沈阳地区部分企业信息以下皆是从上面excel中提取的信息,A.csv为分区结点,C.csv为行业结点,F.csv为法人结点,J.csv为经营结点,Q.csv为公司结点Q2A为公司与分区关系,Q2C为公司与行...
2019-07-16 14:33:37 4310
原创 python 常用函数的记录
(常更)1、enumerate:将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。2、keras.preprocessing.sequence.pad_sequences(sequences,maxlen=None,dtype='int32',padding='pre',truncating='pre', value=0....
2019-07-10 09:07:44 142
原创 Python 正则表达式
常用的正则参考入门(初级篇)“+”代表是字符重复一次或多次。但是我们没有细说这个多次到底是多少次。所以它会尽可能“贪婪”地多给我们匹配字符,加了一个“?”我们就将贪婪的“+”改成了懒惰的“+”。这对于[abc]+,\w*之类的同样适用。元字符 说明 . 代表任意字符 | 逻辑或操作符 [ ] 匹配内部的任一字符或子表达式 [^] 对字符...
2019-07-08 14:04:03 104
原创 正向逆向最大匹配的中文分词
实验语料:人民日报数据、词典由训练语料生成 puk_training.txt:训练语料puk_training_small.txt:训练语料(小)pku_test.txt : 测试语料pku_test_gold.txt:参考答案1、最大匹配法:最大匹配是指以词典为依据,取词典中最长单词为第一个次取字数量的扫描串,在词典中进行扫描(为提升扫描效率...
2019-06-28 16:40:18 631
原创 python CRF中文分词(crf++工具)
实验语料:人民日报数据、词典由训练语料生成puk_training.txt:训练语料puk_training_small.txt:训练语料(小)pku_test.txt : 测试语料pku_test_gold.txt:参考答案crf++工具链接:https://pan.baidu.com/s/1H7ZaifX0lvmfIpG74tLXOA提取码:2beq条件随机场(...
2019-06-28 16:24:20 7459 1
原创 The kernel has died, and the automatic restart has failed
首先排除版本的问题:conda upgrade notebookconda upgrade jupyter结果并没有解决这个问题,试试conda install -c conda-forge prompt_toolkit
2019-06-13 21:15:57 935
原创 文本处理
import re#处理后的文本'''第一行原句........<e1>实体A<\e1>...<e2>实体B<\e2>.....第二行 关系 (语序)第三行 content第四行 空处理后 (按语序)实体A 实体B 关系 (去掉标签)的句子'''store = open('../store .txt','a')#读取文...
2019-05-21 11:26:46 157
原创 使用Keras中embedding的词嵌入的记录
参考了MXuDong博主的博文:https://blog.csdn.net/qq_33472765/article/details/86561245kera的embeding层设置初始值的两种方式:1、使用weights参数指明embedding初始值2、使用embeddings_initializer=keras.initializers.Constant(词向量)如果同时传...
2019-05-15 09:44:33 687
原创 Keras网络可视化方法-问题及解决方法windows
1、Failed to import pydot. You must installpydot打开Anaconda Prompt输入conda installpydot命令重启你使用的工具(pycharm、Jupyter等等)2、OSError: `pydot` failed to call GraphViz.Please install GraphVizgraphviz在...
2019-05-13 18:54:48 166
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人