陌上行走
码龄7年
  • 1,666,060
    被访问
  • 52
    原创
  • 7,847
    排名
  • 743
    粉丝
  • 7
    铁粉
关注
提问 私信

个人简介:就读于东南大学

  • 加入CSDN时间: 2015-07-16
博客简介:

陌上行走的博客

查看详细资料
  • 5
    领奖
    总分 1,265 当月 0
个人成就
  • 获得1,023次点赞
  • 内容获得182次评论
  • 获得3,219次收藏
创作历程
  • 1篇
    2022年
  • 5篇
    2019年
  • 4篇
    2018年
  • 22篇
    2017年
  • 20篇
    2016年
成就勋章
TA的专栏
  • 标注工具
    1篇
  • python
    23篇
  • 数据 挖掘
    4篇
  • c++
    13篇
  • 数据库
    2篇
  • java
    2篇
  • 数据结构
    3篇
  • 算法
    5篇
  • web开发
    2篇
  • 自然语言
    3篇
  • 关系抽取
    3篇
兴趣领域 设置
  • 人工智能
    机器学习深度学习神经网络自然语言处理tensorflow图像处理nlp
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

python判断一个字段是否是mongo ObjectId类型

MongoDB中有一个自动生成的字段:”_id”,类型为ObjectId。在某些业务中,需要提前判断这个某个字段是否是合法的ObjectId。此处可以直接使用bson包中的校验方法。详细使用方法可以直接查看该方法的源码。from bson import objectid# 合法的a = '5349b4ddd2781d08c09890f4'# 有问题的b = "6274da523946a702a7f3b523d"# 返回值为Trueprint(objectid.ObjectId
原创
发布博客 2022.05.06 ·
760 阅读 ·
0 点赞 ·
0 评论

dell服务器开机卡在PCIe device errors页面

在安装和调试实验室dell服务器的过程中遇到了一些问题,特此记录一下。问题:如上图所示,dell服务器在开机或重启的时候,会出现如上图所示的页面,大致问题如下:UEERI0077: One or more PCIe device errors occurred in the previous boot. Check theSystem Event Log (SEL) to ient...
原创
发布博客 2019.10.19 ·
4923 阅读 ·
0 点赞 ·
2 评论

关系抽取工具--IEPY

本来是准备寻找一个关系抽取方面的语料标注工具的,在找资料的过程中发现一个帖子中提到IEPY和DeepDive,DeepDive在之前使用过了,所以就尝试部署了一下IEPY看看是什么效果,记录了一下。IEPY的具体信息可以参考github网址:https://github.com/machinalis/iepy。安装过程参考我的另一个博客链接:关系抽取工具–IEPY...
原创
发布博客 2019.10.19 ·
2589 阅读 ·
0 点赞 ·
0 评论

关系抽取论文笔记集(持续更新中)

分享一下自己精读的一些关系抽取相关的论文笔记,由于中间有些是ppt,为了便于预览展示,所以全部发布在了自己的博客网站上了。1、Reinforcement Learning for Relation Classification from Noisy DataAAAI 2018中的一篇关系抽取方面的论文。此论文提出了一种基于强化学习的关系抽取模型,该模型主要是对具有大量噪声的词袋级别的数...
原创
发布博客 2019.10.15 ·
1085 阅读 ·
2 点赞 ·
0 评论

通知--开新坑了

最近自己在阿里云搭了个个人博客,准备陆续将自己的东西放在上面,便于自由化管理和存储。CSDN上的博客将会继续保留,并且后面会慢慢全部搬到自己到博客网站。喜欢的可以关注下,欢迎多给意见,共同交流,共同学习,共同进步。新的博客网址为:点此查看博客网站正处于起步阶段,后期将不断完善优化。...
原创
发布博客 2019.04.07 ·
352 阅读 ·
1 点赞 ·
0 评论

关系抽取:SemEval2010 Task8数据集

任务描述SemEval2010 Task8详细信息请参考官方文档。任务:对于给定了的句子和两个做了标注的名词,从给定的关系清单中选出最合适的关系。关系清单(9+1)如下所示:关系 定义 例子 Cause-Effect (因果关系) Cause-Effect(X,Y) is true for a sentenceSth...
原创
发布博客 2019.03.22 ·
11720 阅读 ·
7 点赞 ·
10 评论

java调用python代码

    在做项目的时候,有的时候由于合作人员之间所会的编程语言的不同,会导致项目合作中的一些问题,很多时候需要不同语言之间的调用,这次就分享一下java调用python代码的东西。一、python代码运行       巧妇难为无米之炊。首先,要确保python环境配置完好,并且相应的python代码可以运行。这个就不在这里进行讲述了,如果有需要可以查看我之前的一些文章。二、java调用...
原创
发布博客 2018.09.02 ·
9936 阅读 ·
9 点赞 ·
3 评论

windows中elasticsearch5.5.2及head插件安装

   在安装es5.5.2的head插件过程中,遇到了一些问题,这里做一下分享。安装过程如下:1、安装elasticsearch5.5.2(1)首先进入elasticsearch官网进行下载,网址为:elasticsearch下载,如下所示:(2)上图中是es最新版本的下载,其他版本的下载如图中标记所示,点击past releses进行选择,如下所示,然后在列表框进行相应的选择...
原创
发布博客 2018.07.16 ·
1308 阅读 ·
1 点赞 ·
0 评论

自然语言--kenlm环境搭建

      这篇博客主要是分享下小象学院自然语言课程(主讲:史兴)第二讲中示例中kenlm环境搭建的过程,同时也当给自己留个存档。      对于这个环境的搭建,我是在ubuntu16.04的虚拟机中进行的,下面直接进入正题:1、首先看一下此课程中搭建需要用的东西,如下图所示。在运行环境处,对于anaconda和NLTK是很简单的,这里就不多做解释了,如果有需要的可以留言交流。2、直接进入KenL...
原创
发布博客 2018.05.05 ·
4834 阅读 ·
0 点赞 ·
3 评论

编辑距离算法杂烩

       今天分享一下编辑距离的相关东西。定义      首先说一下 什么是编辑距离?在信息论、语言学、计算机科学中,编辑距离是一个测量两个序列之间差异的度量。通俗地说,编辑距离就是从字符串X转换到Y需要的插入、删除、替换的最小个数。对于只有插入、删除、替换操作的编辑距离,是被Levenshtein首先提出和定义的,所以这个编辑距离又叫作Levenshtein距离。在后来,又有一些基本操作被提...
原创
发布博客 2018.03.26 ·
938 阅读 ·
0 点赞 ·
1 评论

python正则中最短匹配

这是因为在正则中,‘*’、‘+’、‘?’这些是贪婪匹配,如用 a*,操作结果是尽可能多地匹配模式。所以当你试着匹配一对对称的定界符,如 HTML 标志中的尖括号。匹配单个 HTML 标志的模式不能正常工作,因为 .* 的本质是“贪婪”的 。在这种情况下,解决方案是使用不贪婪的限定符 *?、+?、?? 或 {m,n}?,尽可能匹配小的文本。
原创
发布博客 2017.12.23 ·
5733 阅读 ·
2 点赞 ·
0 评论

chrome打开网站视频显示no cimpatable source was found for this media

在写了一个视频播放的网页挂在网站后,在edge、ie等浏览器上都是正常的,但是在chrome升级了之后,突然就不能使用了,而是出现了no cimpatable source was found for this media,如下图所示:
原创
发布博客 2017.12.19 ·
38826 阅读 ·
1 点赞 ·
0 评论

python中比较运算符与其他语言的差异

我们都知道,在c、c++等这些语言中,如果出现3<x<7的情况,那么程序是先执行3<x,然后得到true或false,然后再与7进行比较,最后得出结果。那么在python中,这个还是不是这么回事呢?对于x<y<==这个表达式,python中等价于“x<y and y<=z”,也就是说,在python里这个比较的方式是贴近于我们的数学思维的。当然,这个不仅仅局限于“<”号,当然是对于我们使用的这些比较的运算符都是成立的。
原创
发布博客 2017.12.03 ·
1561 阅读 ·
1 点赞 ·
1 评论

java web中url问号传值,中文乱码问题

Invalid character found in the request target. The valid characters are defined in RFC 7230 and RFC 3986,java web中url问号传值,中文乱码问题
原创
发布博客 2017.12.01 ·
8893 阅读 ·
2 点赞 ·
2 评论

mybatis分页查询之sql server--mysql

freemarker.beans Key "location" was not found on instance of org.springframework.jdbc.UncategorizedSQLException.freemarker.beans Key "location" was not found on instance of com.microsoft.sqlserver.jdbc.SQLServerException.sql server使用mybatis中分页查询时出现故障
原创
发布博客 2017.10.25 ·
9662 阅读 ·
2 点赞 ·
0 评论

python3中input输入浅谈

今天谈一下关于python中input的一些基本用法(写给新手入门之用,故只谈比较实用的部分)。       首先,我们可以看一下官方文档给我们的解释(在python的shell中输入命令即可):        上面的英文说的是什么呢?大家有兴趣的可以自己在网上翻译一下,大致说的就是input这个函数,第一个参数是提示语,它默认是空的。在我们使用input的时候,会从标准输
原创
发布博客 2017.10.08 ·
140642 阅读 ·
100 点赞 ·
11 评论

pycharm中使用anaconda部署python环境

今天来说一下python中一个管理包很好用的工具anaconda,可以轻松实现python中各种包的管理。相信大家都会有这种体验,在pycharm也是有包自动搜索和下载的功能,这个我在前面的一篇博客中有相关的介绍(详情请查看点击打开链接),但是这种功能对于一些包是可以使用的,但是总是会遇到有些包下载失败或查询不到的时候,这个时候就会让人很苦恼了。这里我们就来说一下anaconda的好处。   
原创
发布博客 2017.09.24 ·
334650 阅读 ·
58 点赞 ·
20 评论

数据结构(c++)--map划分词典的相似单词

这次分享一下看到的一个map对于相似单词的划分的示例。        首先,我们需要一个存放了很多单词的字典,在上一篇博客中,我已经做好了相关的处理 ,可以参考点击打开链接。        下面我们切入正题。         在我们所用过的英文单词中,许多单词都和其它的单词是相似的,而这些往往记忆起来是特别头疼的,大家都懂的。例如,对于单词wine,替换第一个字母,可以有dine、fi
原创
发布博客 2017.08.12 ·
2706 阅读 ·
3 点赞 ·
0 评论

使用python对文件中的单词进行提取

由于需要使用一个纯单词组成的文件,在网上下载到了一个存放单词的文件,但是里面有中文的解释,那就需要做一下提取了。       文本的形式如下:        所见即所得,这个文本是有规律的,每个单词为一行,紧接着下一行便是单词的解释,有了这种规律我们就很好处理了。       首先我们来将文件的数据读取出来:#coding:utf-8file_object = open
原创
发布博客 2017.08.11 ·
32392 阅读 ·
5 点赞 ·
0 评论

vs2010调试程序

这里分享一个关于vs2010的简单的调试程序的一个视频,由于是自己随便结合例子录制的一个短视频,不足之处多多体谅。        视频的链接为:链接:http://pan.baidu.com/s/1bJrBVg 密码:jci1。
原创
发布博客 2017.05.02 ·
1158 阅读 ·
0 点赞 ·
0 评论
加载更多