自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 jupyter安装与使用

jupytor密钥:‘argon2:argon2idargon2idargon2idv=19$m=10240,t=10,p=88cIT3kLz9hV1gnDprplzWw8cIT3kLz9hV1gnDprplzWw8cIT3kLz9hV1gnDprplzWwrMLp/zyXYt3l6PIuYJ5Y0m7F7Be9GoiYYaHUklgX5Hw’jupyter密码:自己设置的3. 每次如何进入网页jupyter:打开conda prompt, 输入jupyter lab在网页输入自己的地..

2022-04-30 12:48:51 1572

原创 元宇宙与社交

元宇宙及元宇宙社交通用定义,元宇宙(Metaverse)的是利用科技手段进行链接与创造的与现实世界映射与交互的虚拟世界,具备新型社会体系的数字生活空间

2022-04-23 17:14:45 4592 1

原创 深度学习环境配置及github上的模型复现

这是我用到的一个github模型LayoutlMv: 将表单进行结构化处理的预训练模型。利用ocr提取表单中图片信息,transformer对文字和表格信息进行统一处理模型连接:https://github.com/microsoft/unilm/blob/master/layoutlmft/README.md我是按照模型提示的步骤进行操作,到pip install -r requirements.txt出现了问题。原因是我们有配深度学习的环境。接下来是正确的步骤Step1:配C++的环境- 下

2022-04-13 16:27:05 3587 1

原创 富文本文档处理layoutMv

文档智能是一种旨在针对富文本文档进行理解并抽取其中非结构化信息的技术。LayoutLM的成功证明了针对文本和布局进行预训练的有效性。在此基础上,我们提出了多模态预训练模型LayoutLMv2及其多语言扩展LayoutXLM,通过对文本、布局和图像进行联合预训练,进一步提高了模型的性能,在多项任务中取得了新的突破。PPT链接:aka.ms/AAdcz3u富文本文档receiptscanned formdigital-born invoice富文本文档的理解-表单理解传统处理方法:文本进行OCR

2022-04-10 22:40:18 568

原创 doc文件文本结构提取

python-docx模块处理word文档- docx文件docx是Microsoft Office2007之后版本使用的,用新的基于XML的压缩文件格式取代了其目前专有的默认文件格式,在传统的文件名扩展名后面添加了字母“x”docx格式的文件本质上是一个ZIP文件。将一个docx文件的后缀改为ZIP后是可以用解压工具打开或是解压的。事实上,Word2007的基本文件就是ZIP格式的docx文档包含的内容有以下四类段落: 文本 样式-判断段落的种类表格图片其它插入的文件对象代码操作流

2022-04-07 21:33:15 685

原创 TextRank文本摘要算法

摘要提取:对文本进行降维处理

2022-04-07 18:59:02 1796

原创 摘要提取模型--实验一

抽取式文本摘要提取模型的函数结构,算法结构,bug解决,应用思考

2022-04-04 12:06:20 1110

原创 NLP-文本摘要提取

摘要提取思路一.文本基本任务—预处理操作:1.词向量化把词进行量化,得到向量空间的值,得到具体的数值,长度,计算距离,拓展到文本向量和文章向量2.分词中文 :基本语义单元分割英文:按照空格3.词性标注分词之后进行标注4.命名实体识别组织,人,5.文本结构化快递地址识别信息提取案例二.文本应用—分类与聚类:将文本文件分到一个或多个一定好的类别中,涉及文本向量化,序列化标注等新闻稿分类垃圾邮件分类情感类型分类意图识别文本应用—文章标签与摘要提取:从文章中自动提取关键字

2022-04-03 14:08:09 2775

原创 Error : Snap7Exception b‘Job pending

Error : Snap7Exception b’Job pending

2022-01-14 14:38:03 1183 3

原创 树莓派与PLC通信

树莓派与PLC(S7-200 SMART)通信(基于谷歌voice kit提供的系统)通信错误可能的原因(基于树莓派):找不到snap7 library (snap7文件的配置问题,看这篇文章如何解决(73条消息) 树莓派(google voice kit的系统)和PLC S700-SMART通信_tsingxia的博客-CSDN博客)unreachable peer(网络,网线问题)connection refused(百分之99是IP的设置问题,需要把两个设置到一个局域网内)操作步骤:

2022-01-11 16:16:55 4008 1

原创 树莓派(google voice kit的系统)和PLC S700-SMART通信

树莓派(google voice kit的系统)和PLC S700-SMART通信my_plc = client.Client()建立客服端这一步出现找不到snap7的错误解决方法:下载用在树莓派上的snap7文件下载链接:下载之后按照下图所示的步骤在命令行操作:只需要在commen.py文件中增加一行代码:代码的作用是让程序能够调用你的libsnap7.so文件(在windows中安装python-snap7包之,会自动帮我们配置好这个文件,程序直接调用不会出问题。但是使用树莓派且搭载的是

2022-01-10 11:56:44 1023

原创 基于百度语音识别API,利用google voice kit实现语音识别

基于百度语音识别API,利用google voice kit实现语音识别from aip import AipSpeech# from pydub.audio_segment import AudioSegmentfrom aiy.board import Board, Ledfrom aiy.voice.audio import AudioFormat, play_wav, record_file, Recorderimport aiy.voice.audio#百度云平台申请以下帐号,获得以

2022-01-09 23:07:28 1378

原创 树莓派安装中文输入法(使用的谷歌提供的树莓派系统google voice kit)

树莓派系统安装输入法(谷歌语音套件提供的树莓派Raspian系统)提示错误信息:extra junk at the end of file解决方案:给/etc/apt/apt.conf.d这个文件夹权限,然后删除10proxy代理文件文件sudo chmod -R 777 /etc/apt/apt.conf.dsudo -i###切换到根目录sudo apt update###更新软件源sudo apt-get install fcitx fcitx-googlepinyin fcitx-m

2022-01-07 15:23:59 1074 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除