- 博客(12)
- 收藏
- 关注
原创 CEC突发事件语料库转突发事件领域NER数据集
借鉴一篇论文的思路《基于BERT的安全事件命名实体识别研究》-四川大学我想将自己的模型放在小众的数据集上,于是选择了这个数据集。第一部分:XML格式转 BIO标注先空着:第二部分:BIO数据集去除非法字符我的模型的迁移性比较好,只需要在config.py里更改数据集地址,和提取实体种类,在utils.py里更改实体标签,一般可以直接运行,但这个转换后的数据集需要处理,显示错误:解决方案:①我坚信数据集里有非法字符,于是,去网上找汉字、标点符合、数字等的Unicode码,讲这些排除之后,剩
2021-04-14 22:50:02 1674 8
原创 JS小白5分钟上手echarts的实践与示例器上直接运行
(一)5分钟上手echarts的实践**前言:**不了解echarts,看到每篇推文都说要先下载echarts,可我不明白echarts难道是一个exe吗?为啥要先下载,官网上不是有很多示例吗?总之在看了一个5min的演示后,决定先看5min的快速上手是否快速。看到fig1,我以为官方源码和GitHub是并列的关系,所以我点击了fig2中的从镜像网站下载源码,得到一个fig3中名为Apache-echarts-5.0.2-src.zip的压缩包,但是完全找不到教程中出现的echart.min.js.
2021-03-13 20:07:53 1001
原创 jupyter出现IsADirectoryError: [Errno 21]‘’xxxx_path/.checkpoints‘错误
参考了两篇博客:①https://blog.csdn.net/peacefairy/article/details/109668524②https://blog.csdn.net/doreagon/article/details/95071626我的代码就是为了读取一个文件夹下的所有txt文件的段落总数,代码比较简单,只有十几行,但是却出现了题目所示的错误,于是在网上搜到了第一篇博主,她提示问题出现在.ipynb_checkpoints 文件是 notebook运行出错的时候会生成.ipyn
2021-01-28 19:28:11 1711 5
原创 用后面一项去描述前面一项的数字(1)1;(2)11;(3)21;(4)1211;(5)111221···
问题定义:比如“1234”,代表1个2,3个4,形如(1)1;(2)11;(3)21;(4)1211;(5)111221···的表达就是用后面一项去描述前面一项,比如说(3)21,就是 1个 2,1个 1,写作1211,就是第 4项想着要用递归的方法来写,但是一个递归函数本身不像斐波那契数列那样有规律,应该需要两个函数因为我们能读懂题目本身的含义,就是你得判断每一位数字是什么以及它跟后面的数字是否相等f(n)就是基本的递归函数,cal(n)是用来判断每一个f(n)每个位置上的数字是多少以及跟相邻位.
2020-09-28 18:34:11 828
翻译 如何评价NER的识别结果或者以什么方式来计算识别结果
(1)一篇中文翻译https://www.lizenghai.com/archives/32147.html,但是我没有看懂,所以我才去找了其他的博客,但是他提出了:命名实体识别评测方式分为两种,一是通用的基于token标签进行直接评测,二是考虑实体边界+实体类型的评测。基于token的最容易理解:只需要比较每一个token识别出的标签与原标签,最为简便,不需要考虑边界情况,第二种需要参考一下这篇博客(2)来自英文原博客http://www.davidsbatista.net/blog
2020-09-08 15:37:34 883
原创 conda install flask命令成功显示的界面该是什么
为了确认是否安装成功,按照一篇博文的指示:https://blog.csdn.net/weixin_42600599/article/details/84063418->python>>>import flask>>>flask.__version__
2020-09-06 10:44:46 430
原创 循环语句中的return返回;re.search;index函数;pdf转为txt后的编码
Python中的return语句 遇到第一个就返回,所以循环语句中如果出现了return,那么执行return后不再执行循环语句Python中的re.search用法,如果没有匹配到,则返回一个none object,而不是match object 不要奇怪Python字符串的index函数,如果关键词不存在在字符串中,则引发异常,所以使用try 和except使用WPS的pdf转为txt后的编码是GB2312,所以要转换为utf-8强烈推荐python 菜鸟教程中关于正则表达式的介绍htt.
2020-08-02 22:15:11 348
原创 问题集结sys.argv[]、u字符串 decode >=
Python中 sys.argv[]的用法简明解释https://www.cnblogs.com/aland-1415/p/6613449.htmlSys.argv[ ]其实就是一个列表,里边的项为用户输入的参数,关键就是要明白这参数是从程序外部输入的,而非代码本身的什么地方,要想看到它的效果就应该将程序保存了,从外部来运行程序并给出参数。python出现了u’str’,之前只见过r’str’,通过下面这篇文章知道了r’str’一般用在正则表达式模块,u字符串是为了告诉python将这个字符串保存
2020-08-01 10:33:50 150
原创 在python3.6和3.7下安装pyltp一些步骤整理
我是个编程白痴,所以我的错误原因千奇百怪,我的叙述也不太有逻辑,敬请见谅首先确定盲目的使用pip3 install pyltp安装,不可以因此去搜索,根据搜索的结果判定目前python3.7还不支持,尽管出现了有个博客中说将.whl文件改名为37的做法,但是最后证明还是不可以决定下载python3.6(我之前的python、anaconda都不是自己动手装的,因为我非常惧怕这些东西,但是现在不得不自己动手)听说过新建项目可以使用新的编译环境,但是从来没有尝试过,所以这次也需要操作一下
2020-07-29 21:00:43 2102 1
原创 小白安装elasticsearch,请教了很多博客
我属于NLP领域小白,还没有成功完成过项目,但是先安装了一些工具。我已经安装了neo4j和protege。今天安装elastic search。起因如下:看到了一篇文章:基于ElasticSearch的问答系统(KBQA)https://blog.csdn.net/keyue123/article/details/85317774想做一个demo出来,因此心血来潮想下ES。但这条路不容易。首先参考:windows环境下elasticsearch安装教程(超详细)https://www..
2020-07-20 22:36:52 248
原创 解决tensorflow zero小问题
我的TensorFlow版本是1.13.1然后在执行biases= tf.Variable(tf.zero[1])时报错,没有查到原因我就把zero换成了zeros变成了biases= tf.Variable(tf.zero [1])成功运行了,但是会有警告,如果有大神会,可以解释一下原因...
2020-07-20 22:19:57 330
原创 字符串包含浮点数,将其转换为datetime类型,来自Python123的练习题
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入如何将ISO 8601日期时间字符串转换为Python日期时间对象?欢迎使用Markdown编辑器你好! 这是你第一次使
2020-05-19 16:46:54 382
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人