- 博客(7)
- 资源 (4)
- 收藏
- 关注
原创 Python 注解方式实现缓存数据
背景每次加载数据都要重新Load,想通过加入的注解方式开发缓存机制,每次缓存不用写代码了缺点:目前仅支持一个返回值,虽然能弄成字典,但是已经满足个人需求,没动力改(狗头)。拿来即用新建文件 Cache.pyclass Cache: def __init__(self, cache_path='.', nocache=False): self.cache_path = cache_path self.cache = not nocache def _
2021-10-18 23:17:20 846 1
原创 代理方式部署NER标注平台doccano
代理方式部署NER标注平台doccano背景从事NLP工作的小伙伴或多或少会接触数据标注,这里要提到老牌的brat1标注平台,只需一个简单的配置文件和一个存储标注数据的文件夹即可完成搭建。由于brat标注平台出现的比较早,网络上有大量的文章可以参考2。最近在阅读NER商用化经验时,无意发现了一个开源的标注平台doccano3,UI很酷,功能也比较丰富,重点是持续更新中。最近正好有一个NER标注的任务,借此机会,我们开始进行非常规网络环境下的标注系统搭建。中间会夹杂一些pip知识和Linux服务器连网攻
2021-10-15 23:18:51 1197
原创 ElasticSearch搜索引擎搭建笔记
搜索引擎调研Solr Solr是一个用java开发的独立的企业级搜索应用服务器,它提供了类似于Web-service的API接口,它是基于Lucene的全文检索服务器,也算是Lucene的一个变种,很多一线互联网公司都在使用Solr,也算是一种成熟的解决方案. 官方主页:http://lucene.apache.org/solr/ Elasticsearch Elast...
2018-10-04 10:46:36 4697 1
原创 CentOS7.2安装pyspider
按照pyspider官方QuickStart,安装pyspider之前先安装pip,下面命令直接摘抄了http://blog.csdn.net/myfancysky/article/details/48847971wget https://pypi.python.org/packages/source/p/pip/pip-7.1.2.tar.gz#md5=3823d2343d9f3
2016-10-25 23:59:57 1799
原创 代码去注释正则匹配规则
代码去注释正则匹配规则利用Notepad++,EditPlus等文本编辑器替换功能,删除代码中注释。规则还不太完善,以后会改进。正则表达式: 匹配规则 匹配内容 替换内容 /*{content}*/ /\*([\s\S]*?)\*/ //{content} //(.*?)\r\n \r\n 匹配换行 \r\n([\s]*?)\r\n \r\n 整体
2016-10-25 15:30:46 982
原创 bat脚本设置临时系统环境变量
有这样一个场景,需要在一台电脑上运行C#和matlab混编的程序,但是这台电脑为了其他软件需要已经安装了matlab,而且两个软件所需要的MCR版本不一致。所以,这个时候设置临时系统环境变量,可以在不影响原有程序运行的基础上满足软件指定路径的需要。其实原理很简单,安装软件的时候,都会修改系统环境变量Path,将自己的路径追加到最后面。windows 环境变量Path前面优先级最高,
2016-10-25 14:12:08 15471
en_core_web_sm-2.0.0.tar.gz
2018-11-29
en_core_web_sm-2.1.0a0
2018-11-28
marktext-0.13.65
2018-11-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人