自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 git终端操作基础

如何使用git管理代码1.首先第一次使用需要到git 上配置ssh key按照官网的步骤配置即可官网地址:connecting to Github with ssh配置好ssh 后使用git branch -r # check the remote branchor git branch -a # check the remote and local branch绿色为当前所在分支默认情况当前所在分支是,master 分支需要创建本地分支dev 并切换到dev分支git branch

2021-03-21 16:50:39 107

原创 about library os

os 的使用import oscurrent_path = os.getcwd() # get the current pathfather_path = os.path.dirname(current_path)# the parent pathos.path.dirname(father_path) # get the grandfather pathos.path.join(current_path, "filename.txt") # the filename.txt path..

2021-03-18 09:56:34 122

原创 regular expression

正则表达使用import restring = "今天是个好日子"pattern = re.compile(r'')# 先编译一个pattern 然后再用pattern 提取速度较快match = pattern.match(string)if match: print(match.group())

2021-03-17 21:31:32 59

原创 使用python从URL 获取数据

python download data with URL直接上代码import requestsdef download(): """download data from the URL""" corpus = requests.get('your url') print(corpus.content) with open("./download.txt", "wb") as f: f.write(corpus.content)#终端运行down

2021-03-11 10:50:41 366

原创 文本标注工具使用

@暂无标注环境创建安装docker标注工具使用参照https://github.com/doccano/doccano终端运行入下代码docker pull doccano/doccanodocker container create --name doccano \ -e "ADMIN_USERNAME=admin" \ -e "[email protected]" \ -e "ADMIN_PASSWORD=password" \ -p 8000:80

2021-03-09 14:18:34 272

原创 pip更新失败问题

1,使用python -m pip install --upgrade pip升级失败2,使用python -m pip install -U --force-reinstall pip依然失败3,使用pip install --user --upgrade pip成功升级以上三个都是pip更新失败,使用下面命令成功easy_install.exe pip...

2020-07-28 16:37:50 315

原创 划痕验证码识别

验证码识别步骤,1 利用直线检测及霍夫变换可以定位到验证码的矩形框即定位到ROI区域;2 图像灰度化,滤波,二值化,得到图像像素值只有255 和0 的像素矩阵;3 观察像素矩阵,根据验证码的字符之间的像素较少的原则可以去掉字符之间的不必要像素;4 再通过图片形态学操作可以进一步分割字符;5.最后识别字符(调用 API或者机器学习方法识别)...

2020-07-13 13:56:08 355

原创 文本相似度笔记

文本相似度的计算常用夹余弦值来计算;1.为什么用夹角的余弦值类计算文本相似度更好?这里举一个例子文本一般长短不一,假设文本1内容:我喜欢看书;文本2内容:我喜欢喜欢看看看书书书;文本3 内容:我喜欢看图;将三个文本向量映射到高维空间后发现欧氏距离文本1,3比文本1,2更近,但是能说明文本3比文本2更接近文本1吗?实际如果看三个向量的夹角,发现文本2与文本1的夹角要比文本3与文本1的夹角小,所以通过夹角来比较相似,在这里看是更合理的。由以上看出使用夹角余弦对文本相似的进行比较是更好的。比较

2020-05-24 10:13:28 346

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除