自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 远程桌面部署doccano数据标注平台

远程桌面部署doccano数据标注平台1、云服务器:我选择的是腾讯云服务器,价格为69.5元/月,配置如下图所示:购买后,会有远程桌面连接的用户名和密码,直接访问即可。2、doccano部署过程下载汉化后的一个doccano工程网址https://github.com/moon-hotel/doccano,复制到服务器上。安装python这里也可安装conda虚拟环境,我安装的是python3.6.5版本,官网上下载安装包后安装即可,安装后记得添加python和pip的环境变量。安装pyt

2021-03-01 23:32:28 990 2

原创 python处理文本中英文标点符号转变

#中英文标点符号转变import osdef E_trans_to_C(string): E_pun = u',.!?[]()<>"\';:' C_pun = u',。!?【】()《》“‘;:' table= {ord(f):ord(t) for f,t in zip(E_pun,C_pun)} return string.translate(table)rootdir=r'D:\book\语料'list1 = os.listdir(rootdir)

2020-12-21 22:50:00 1007 1

原创 百度文字识别API调用

百度文字识别API调用官网获取api和secret kkey调用API接口官网获取api和secret kkey百度AI智能平台通用文字识别:https://ai.baidu.com/tech/ocr/general创建应用即可,可选择适合的文字识别类型,如标准版、精确版等等,使用文档会有详细说明和调用方法。调用API接口分享源代码:# -*- coding: utf-8 -*-# !/usr/bin/env pythonimport osimport jsonimport requ

2020-12-15 23:30:30 485 1

原创 爬虫实用技巧

爬虫实用技巧(更新中)链接的获取快速定位链接url连接函数文件的下载文本获取图片下载小技巧字符串格式问题列表转换为字符串链接的获取快速定位链接首先,查看网页的源代码(F12即可,然后点击左上角箭头,基本可以随鼠标定位某个位置的源代码)。其次,用正则表达匹配所需链接位置。html代码:<a href="kewen.htm" target="_blank">课文原文</a>python代码:rr2 = re.compile(r'<a href="(\S*)" ta

2020-12-14 23:31:50 205 1

原创 pytorch安装实用网址以及报错解决办法

pytorch安装实用网址报错解决办法实用网址1.https://www.python.org/downloads/release/python-362/貌似torch1.7版本需要python3.6.2以上,所以可以先升级一下python版本。2.https://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy这是numpy的下载地址,根据自己电脑的python版本以及操作系统下载即可,我下载的是numpy‑1.19.4+mkl‑cp36‑cp36m‑win_a

2020-12-02 23:19:02 315

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除