streamlit 学习 4、通过subprocess 库,将上述的三步写成python文件。运行该文件后即可启动页面,并且该方式没有命令行的黑框。3、在程序运行期间,需要保障命令行不关闭否则会出现连接不上的问题。2、在cmd中运行python 文件,启动一个网页。命令 cd D:\code\streamlit。1、先切换目录到Python文件放置的目录下。修改py文件并保存后,刷新网页即可。
Python制作精美表格——plottable 在matplotlib中,linestyle参数接受一个元组(offset, (on, off)),其中on表示线段的长度,off表示间隙的长度,而offset是线段开始前的偏移量,一般默认为0。如果你希望得到较长的线段和较短的间隙交替的虚线效果,可以增大on相对于off的值。1、原始数据数量较少,可以一屏展示。这个库会将原始表格的所有数据都放到一个图片里,数据太多展示效果较差。plottable是一个基础matplotlib的绘制精美图形表格的库。奇偶行设置不同的颜色,让表格看起来有层次感。
典型神经网络模型—自编码器 在神经网络中,编码器(Encoder)是一种用于将输入数据转换为另一种形式的网络组件或模型部分。编码器的核心任务是将原始数据压缩或转换为一种更紧凑、更具代表性的形式,通常是为了便于存储、传输或进一步的分析处理。编码器的模型在编码器中最常见的是自编码器,可以起到数据压缩和降维的作用,相比于PCA他可以完成非线性的降维。
自注意力机制的理解 自注意力机制实际上是注意力机制的一种,它也是一种网络的构型,它想要解决的问题是网络接收的输入是很多向量,并且向量的大小也是不确定的情况,比如机器翻译(序列到序列的问题,机器自己决定多少个标签),词性标注(Pos tagging 一个向量对应一个标签),语义分析(多个向量对应一个标签)等文字处理以及图像处理中。2.1、生成查询、键和值:对于每一个输入嵌入向量(例如,每一个词向量),通过线性变换(或称为权重矩阵乘法)生成对应的查询向量(Query, Q)、键向量(Key, K)和值向量(Value, V)。
使用Spacy做中文词频和词性分析 在没有GPU的情况下,模型推理巨慢无比,可以考虑使用以下的多进程方式,其中nlp = spacy.load(‘zh_core_web_trf’)可能无法pickle,需要放入analyze_text(paragraph_text, nlp)函数内部。需要确保你的Spacy版本是最新的,因为zh_core_web_trf是一个基于transformer的模型,因为它包含了整个transformer模型。zh_core_web_trf模型,模型大,准确性高。1、为什么选择Spacy库。
视频业务像素、带宽、存储空间计算 1小时的秒数)×24(单位:小时;一天的时间长)×30(保存的天数)×50监控点要保存摄像机录像的总数)÷0.9(磁盘格式化的损失10%空间)=所需存储空间的大小(注:存储单位换算1TB=1024GB;1MB=1024KB)1路存储1天的720P(100万像素)视频格式录像信息的存储空间所需大小为:256×3600×24×1×1÷0.9÷1024÷1024=23.44GB。1路存储1天的1080P(200万像素)视频格式录像信息的存储空间所需大小为:512×3600×24×1×1÷0.9=46.88GB。
flask框架制作前端网页作为GUI 您将看到一个包含三个按钮的页面,每个按钮都链接到一个表单,用于上传本地文件。读取文件到app文件夹下并将文件名写入对应的txt文件(现代浏览器不允许获取本地路径),后续通过读入txt的文件名来拼接路径,读取app文件夹下的文件。templates/:模板文件目录,用于存放应用的HTML模板文件。创建一个名为templates的目录,并在其中创建一个名为index.html的文件。README.md:应用的说明文档,包含了应用的运行方法、配置说明等。app.py:应用的入口文件,包含了应用的初始化和配置。
pandas增强—数据表的非等式连接和条件连接 主要是对空值、列的增删的处理,和各个行业(如金融)等封装的清洗方法。2、使用pandas的功能增强库pyjanitor 库的 conditional_join 函数,既节省内存又不损性能;2、对于时间序列可以使用asof来连接。缺点是功能受限,不是所有的条件筛选都能用asof,特别是非时间序列的情况下。该方案的有优点是代码和pandas高度兼容,如果只做简单的不等连接可以使用,复杂的条件还需要DuckDB。对于使用到的pyjanitor 库,它是一个从R迁移来的python库,主要有以下3方面的功能。
PDF操作,PDF提取文字并统计词频—快速预览PDF报告, 1、 PyMuPD网上有许多资料,但是多数比较老,这个模块的API已有变动,本文做了更新。本模块安装需要pip install PyMuPDF,但是导入是fitz。该库不支持python3.10以上版本。,注意这两个库暂时不支持python3.10以上的版本,主要是paddleocr依赖的PyMuPDF不支持python3.10以上版本。有许多PDF是图片格式,并不能直接提取文字。本文采取PDF转图片,并通过OCR识别文字生成文本,进而统计文本的词频的方式进行快速预览。读取结果、使用结巴分词,并统计词频。
draw.io基础操作、代码高效画图和批量操作图形 实现方法1:鼠标放在图形边缘等待出现蓝色箭头,鼠标左键点击图形上的箭头。如果拖动其中一个图形的话,固定链接的形状会自动变为直线连接。如果拖动其中一个图形的话,固定链接的形状会是曲线连过去。鼠标放在图形上,点击出现的箭头,会自动出常用图形。点击第二张图中红圈的黄点,改变成图标的形状。上面左边出现绿圆点+鼠标左键点击图形的。2、shift+小蓝点 等比例拖动。不放+拖动链接另外一个图形的。ctrl+拖动鼠标 快速复制。ctrl+c/v 复制+粘贴。+拖动链接到另外一个图形+1.1、自动连接图形。
python 文本纠错库pycorrector的使用(API变更,许多介绍文章已不可用) pycorrector是一个nice的中文检测库,在最新的版本API变更,导致许多之前的介绍文章不可用。现将新API粘贴如下。
使用python电脑轻量级控制手机—adb命令和手机投屏 输入adb pair 手机IP:端口后会自动弹出输入配对码的命令行,输入下图红色的配对码即可。通过电脑控制手机有多种方式如appnium等,本文介绍的是两种轻量级的方案,使用adb命令刚和手机投屏。在手机上打开开发者选项,启用显示指针位置或显示触摸位置选项。2.1、adb pair 手机IP:端口,下图蓝色部分的ip和端口。3、使用pyautogui等屏幕点击库控制投屏区域,进而控制手机。控制多个手机 adb -s id 命令。控制一个手机 adb 命令。通过adb 命令控制手机。1、adb 连接手机。
使用Python批量操作PPT—修改字体、提取文字到word、插入图片、合并多个PPT 只能修改英文和数字,并且run.font.name识别的也是英文和数字的名称。因为这个包,没有针对汉字的API,而且这个包很久没更新了,开发者提供了解决思路是修改office文件的底层xml来实现,修改xml中的a:ea的typeface属性,网上已经有人用 pptx_ea_font 这个包实现了该功能。将一份PPT的每一页字体、大小、是否加粗都统一,是一个常见需求。在python操控PPT常用库python-pptx中有一个bug,对字体的修改只能修改数字和英文字母,无法修改汉字。
十天通过软考之计算题 2、将波浪线上的活动(注意有时是活动组(入下图的BD B是D的紧前,B和D都可以移动,但是D肯定在B后面))自由移动,求准确的最小人数。β分布,一次实验的结果只有0和1两个选项(伯努利实验),已经观察到a 次0 和b 次1 ,估算出来的分布。自由时差:代表最大可支配时间 为 min(紧后活动的ES)-此活动的EF 注意:紧后活动的最小值=前一项活动的最大EF。偏差分析,使用减法,强调的var(差), 绩效分析(除法),强调的是 Performance Index (指标)