自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

@独寂

孤独是优秀者的必修课

  • 博客(9)
  • 资源 (1)
  • 收藏
  • 关注

原创 git指令对本地仓库操作,以及使用git随机上传本地文件到github远程仓库。

----------------------------------本地仓库操作------------------------------------- -----------删除文件----------- 指令操作流程:```python` import``①rm -rf filename 删除本地文件`在这里插入代码片`②git rm filename 删除暂存区文件③git commit -m‘描述’ 提交到git

2020-11-09 16:35:52 214 1

原创 windows系统下查看gpu使用情况

       前段时间在家学习由于用到gpu,需要配置cuda可以说是脑壳疼,不过还好最终配置好了,总的来说就是环境配置的问题,不是python版本就是tensorflow版本要不就是cuda版本没有对应好。       配置好了那我在运行深度学习项目的时候肯定要查看一下gpu利用的情况,一下是一些关于gpu信息描述作为学习记录。       ①首先进入到C:\Pro

2020-08-14 09:52:12 2549

原创 用于图像字幕生成(image caption)数据集

用于图像字幕生成(image caption)数据集       本来好好的开学就可以去师兄公司实习了,由于疫情,无奈之下只能在家做科研了,在老师的每周的催促下,好悲催,每天拖动着似乎疲惫的身躯被迫学习,哈哈,但是也不能过于表现痛苦的表情哈,终究是和老师表过态要好好学的,不好意思,跑题了。       ...

2020-04-09 17:52:02 1557 9

原创 自然语言处理之维特比算法实现中文分词

维特比算法实现中文分词实例维特比(viterbi)算法介绍功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入维特比(vi...

2020-01-11 15:38:27 1493 1

原创 自然语言处理之中文分词逆向最大匹配算法(RMM算法)

       经过了一阶段的学习上课,现在已经开始开始在自然语言处理的道路上安心研究,最近看了一本叫《python自然语言处理实战核心技术与算法》,大致的溜了一遍,感觉写的很基础了,个人认为主要写的好的地方就是既有说明又有代码示例,同时还有实战练习,这对我一个初学者来说,可以说是大有裨益。   &n...

2019-11-18 21:51:17 1482

原创 python爬虫基础(这里我自己写了一个基础代码爬取了一下39健康网的两万多的药的数据)

       作为一个小白,在跟着老师在学习自然语言处理道路上,时时刻刻提醒自己要好好学习,有一天要出人头地,报答家乡父老???? 。       话不多说,进入正题,我们都知道自然语言处理的前提就是基于大数据的,没有数据还谈什么数据处理呢?所以我自己学习了一下有关...

2019-10-25 19:15:23 1407 20

原创 如何使用markdown编辑器插入本地图片

    作为一个小白,前一段时间写博客的时候,插入完代码后需要在后面添加图片演示,但是由于编辑器局限性还不能上传本地图片,但是在网上查了很多方式,怎么也不好使,无意间碰到这么一种方式,其实很简单,网上有的说的很麻烦的事。<div align=center><img src="此处为图片连接"/></div>    最基本代码格式如上,如需调整图片位置...

2019-09-04 16:53:46 4846

原创 统计词频,使用matplotlib画图验证齐普夫定律

    以下我是用了人民日报的数据和英文数据进行分词,这里我是用的是pkuseg这个分词工具,原因是当时我读了一篇关于翟天临的文章,关于计算相似度,里面使用的是这个工具,然后我是用的是哈工大的停用此表,统计词频、排序等进行一系列的文本与预处理。接下就是使用matplotlib画图啦。#-*-coding:utf-8-*-from collections import Counterimp...

2019-08-19 17:50:58 1238 1

原创 文本预处理/计算文章相似度(通过计算杰卡德系数计算文本相似度)

#-- conding:utf-8 --import pprintfrom collections import Counterimport jiebaimport numpy as np#数据抽取(从文件中读取)file_path=‘1.txt’def readFile(file_path):content = []with open(file_path, ‘r’,encodi...

2019-08-19 16:00:05 850

用于做OCR的数据生成的效果图片以及相应的标签文件示例

用于ocr的数据生成,生成的效果为上图,其中还包括生成的图片上的文字对应的位置坐标,上面文件只包含部分示例。源码请关注我的博客,留言。谢谢!~

2020-11-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除