0XIX0-CSDN博客

原创远程控制软件代码分享及AI写代码经验（兼容uos，支持Wayland，20250903）

对于使用国产电脑搭载UOS系统且面临网络限制（向日葵、todesk已经被禁用）的用户来说，远程访问可能面临一些困难。

2025-09-05 10:56:27 1124

原创 omniparser v2 本地部署及制作docker镜像（20250715）

关于 omniparser v2 本地部署，网上资料不算多，尤其是对于土蔷内用户，还是有些坑的。

2025-07-15 20:35:43 1416 3

原创下载Bing 网页的每日背景图并添加到系统壁纸库中的代码分享

使用 AI 助手编写自动化测试程序的一个问题是，AI 助手并不知道网页结构。本文中，我自己写了 xpath 并告知 AI 助手，指引 AI 助手理解任务。我在无头模式运行失败后，让豆包给我生成了测试代码（代码中被注释掉的部分）截屏，截屏里没有加载其他按钮。Bing 网页每天都有精美壁纸。请用Python编写一个程序，它能够自动访问必应网页，下载该网页上的每日图片，并把它加入Ubuntu系统的壁纸库中。2、鼠标悬停在如下元素上： xpath=3、鼠标点击下载按钮：xpath=4、保存图片并加入系统壁纸库。

2025-06-19 10:49:43 345

原创 PDF文件合并、删除特定页面的工具分享

为了应付日常使用，我用豆包写了一个PDF文件合并、删除特定页面的工具。- 选择文件区域下方是“开始合并”按钮。合并完成后弹出合并后的文件已保存的提示框。最明显的就是整个窗口的大小，他最初设置的不对，隐藏了一些按钮。- 选择文件区域与“开始合并”按钮合属于一个操作区。- 待删除页码输入框支持一次输入多个页码，中间用“，”隔开。- 界面上方是一个选择PDF文件的区域。- 页面删除操作区包含一个待删除页码输入框、“删除”按钮.点击“删除”按钮后保存。用 python 编写一个PDF合并、删除特定页面的工具。

2025-06-12 16:43:29 624

原创 Ollama单聊非流输出python代码分享及工单检查任务 / prompt的经验（20250215）

2、Qwen1.5 这种不带 CoT 的，prompt 不能写的太隐晦。还有数字处理问题，可以把60分、90分换成“合格”、“优秀”之类的词汇。需要复杂分析的，可以交给 Qwen2.5 之类带 CoT 的。1、考虑到成本问题，像 deepseek 之类的带 CoT 就没必要了。我是用 Qwen1.5 做第一遍过滤，Qwen2.5 做进一步思考，这样整个流程会快一些。不知是不是网上错误代码多的原因，导致AI 被污染，我用 AI 写代码总是出错。由于我处理的是批量工单数据，所以单次聊天、非流式输出就够用了。

2025-02-28 15:20:12 522

原创国产系统麒麟/UOS 用 python 从局域网共享文件夹复制文件（20250225）

2、smbclient 命令。用 python os 库执行 smbclient 命令时，如果有多条的话，构造起来偏复杂。代码中注释了需要执行的几条命令，可以现在命令行尝试是否成功，再用 python 代码执行。总是出错，而且很难排查。所以还是 mount 命令比较方便。

2025-02-25 09:50:36 795

原创用 Python 给 Excel 表格截图（20250207）

我搜索了网络上的方案，感觉把 Excel 表格转换为 HTML 是比较顺畅的路径，因为有顺畅的工具链。如果使用的是 Windows 系统则不需要阅读此文，因为 win32com 库更方便。这篇文章中 Excel 转 HTML 的方案，主要弥补了网上其他方案中存在合并单元格的情况。代码为智谱清言帮助生成，有些变量控制还是需要自己改一下。

2025-02-07 17:23:29 698

原创 playwright 自动化操作含有多个查询条件页面的代码分享（20241210）

镜像地址可能发生变化，还是按照我上面说的调试 xpath 的方法，先输入前一段 url 然后逐步延长，根据网站返回的消息逐步构造出完整的 url。2、时间选择控件的xpath 比较长，下面代码里包含了我的调试方法，就是逐步打印出来看是否找到正确的 DOM ，逐步延长xpath路径，直至找到我需要的DOM。填文本的功能写在一个代码段，时间选择的又是一个代码段。其他使用 Vue 写的页面，时间选择控件、树形结构选择的控件应该类似，所以可以参考这个案例。阅读代码时，可以先看所有的函数名，应该能猜到代码架构。

2025-01-12 21:02:23 391

原创 Python代码实现发送网易163邮箱邮件 - 含图片（20241205）

网上参考了很多今年发的相关文章，都是失败的。首先在163邮箱里开启IMAP/SMTP 服务，获取授权码。

2024-12-05 15:31:18 783 2

原创 Windows换机华为擎云（银河麒麟V10+麒麟9000C CPU）后，使用selenium的程序怎么办（20241030）

首先，playwright 在安装时，只需一条简单的命令即可自动选择合适版本的支持环境，Chrome、firfox、edge 都支持。微软的产品能力还是很强的。而且为了系统稳定，原来的版本最好保留。Firefox有一个geckodriver版本与Firefox版本的对照表，我看了一下，感觉他们是始终跟进新技术的。银河麒麟的很多库都是几年前的，如果要升级，就要升级一大批，不升级的话，想让多个库相互匹配，感觉工程量也不小。edge 驱动我试了一下，老是不识别，找了半天没找到原因，我也放弃了。

2024-11-04 16:17:34 3089

原创华为擎云（银河麒麟V10+麒麟9000C CPU）电脑总是弹出“选择新密钥环的密码”（20241030）

麒麟系统用的是 Gnome 桌面。这个“密钥环”的弹出框是由 gnome-keyring-daemon 弹出的。这是一个管理密码的服务。类似于手机上，当你打开一个软件，系统自动就把密码填进去了。台式机上必要性不大。所以，最简单粗暴的方法就是卸掉他。当然也可以配置自动登陆。好像是使用PAM模块。不知道为什么，这对我的这台电脑并不可行。

2024-11-04 16:14:17 3337

原创可以自动点击网页按钮的 Chrome 插件（manifest_v3 20241008）

2、本项目涉及到的这个 vue 单页应用的网址中是包含“#”号的。在 manifest.json 配置文件中，想在网址中填带“#”的网址也是没用的，插件不支持。1、调试时 background.js 的 console.log 的输出可以在浏览器插件页面（如下图的按钮点进去）中看到。content-script1.js 的日志输出是在网页打开后，打开“开发者工具”的控制台，里面可以看到。分享那个这个案例的意义在于，vue 单页应用不同于一般的网页，他有很多事件是不触发的，需要自己想办法处理。

2024-10-08 21:03:03 4845

原创 BERT词向量的特性

BERT 词向量的特性

2023-01-19 15:38:38 370

原创 chrome插件自动点击页面元素自动填入内容

chrome 插件实现自动点击、自动填写内容。

2022-12-28 16:47:45 6921

原创 Excel 表格删除重复数据

Excel 表格删除重复数据

2022-11-11 15:57:25 870

原创 Selenium ActionChains 循环使用失效，dict fromkeys初始化等小提示

易错点

2022-05-07 14:08:21 1461

原创 QtWebEngine automation 自动化操作

早期版本的 QtWebkit github 上有 Cisco 的 automation 开源项目。Qt 后来采用的 QtWebEngine 我搜了很多英文网页也没有成熟框架。只有通过其他方法曲线解决了。1、记住鼠标点位（电脑屏幕取点工具），用 pyautogui 去点击。2、分析网络协议。使用工具 ecapture ，只能在 linux 下运行。3、在加载的页面里，打开调试窗口，输入JavaScript 代码。4、图像识别，paddleOCR 识别文字效果很好，再结合 opencv 检测文.

2022-04-24 11:03:27 5762

原创如何理解注意机制中经常提到的键、查询和值 ?

本文探讨了transformer中的注意力机制的直觉。

2022-01-12 20:28:07 6881 1

原创百度智能云NLP的使用及文本相似度

百度智能云API 接口的使用应该说是很方便的。但是网上代码资源不多，还有运行不了的代码，误导了我很久。在此发文一篇，分享2021年12月30日可运行代码，并实现了对比两段事件描述相似度的功能。import json,requests,os,refrom openpyxl import load_workbookfrom time import sleepimport numpy as npAPIKey='*****'SecretKey='*****'#创建请求urldef get_A

2021-12-30 18:09:28 1632

原创 Faster-RCNN 入门（也包含 Fast RCNN 的技术）

本文集合了 Faster-RCNN 的关键技术，了解 CNN 以后就可以看本文。SelectiveSearch目标检测物体的候选框是如何产生的？　　如今深度学习火热的今天，RCNN/SPP-Net/Fast-RCNN等文章都会谈及bounding boxes(候选边界框)的生成与筛选策略。那么候选框是如何产生，又是如何进行筛选的呢？其实物体候选框获取当前主要使用图像分割与区域生长技术。区域生长(合并)主要由于检测图像中存在的物体具有局部区域相似性(颜色、纹理等)。目标识别与图像分割技术的发展进一

2020-07-11 10:42:00 1176

原创 chrome 插件--B站自动发弹幕

chrome 插件实现自动点击、自动填入内容。

2020-07-11 09:48:20 4813 3

原创微信小程序加载动画

补充一下这篇文章里的第二个例子的代码。wxml 文件：<view class="tui-loading-row"> <view class="tui-loading-cell">  </view> <view class="tui-loading-cell"> <view class="circle-line-spin" > <tex...

2020-06-10 20:10:04 2172

原创 Ubuntu 安装 Android Studio 全过程记录（2020年1月）

不同时期，不同版本安装方法也不同。这是我在2020年1月的安装过程。版本 lubuntu 18 + jdk8_202 + Android Studio 3.5.31.安装jdk先下载 jdk8 地址：下载 jdk下载完以后运行安装：sudo update-alternatives --install "/usr/bin/java" "java" "/jdk/jdk...

2020-02-22 20:31:06 3593

原创 wxPython Grid 表格控件的使用

因工作原因使用了一下 wxPython。总的来说不推荐。我的观点是干什么事情，要用那个领域最成熟的库，比如桌面软件，用 C#、Qt。不流行的的 wx 有 bug，参考文档少。下面贴出我的代码。这个代码展示了 Grid 的使用，可以“增删改”，按列排序，隐藏某一列的显示（就像在 Excel 里为了看东西方便）。界面设计可以先用 wxFormBuilder 设计好，把代码 copy 过来。有些问题不好...

2020-01-12 16:05:29 8637

原创对 Capsule Network 的理解

先推荐一篇对胶囊网络讲解很详细的文章。Capsule Network 很重要的是解决了如果一张图片中，鼻子眼睛的位置是错的，如何识别出它不是一张脸的问题。那么我们来思考一下它为什么有这个能力？在最后一层的 10*16 矩阵中，假设 16 个数代表鼻子或者眼睛中的一个东西，那么两个数对调，模型结果会变化吗？不会。因为后边接的是全连接网络，和普通的 CNN 没什么区别，你把这 16 个数全打...

2019-12-21 11:08:43 658

原创 SQL语句创建视图为什么不能用order by

很多地方都没解释清楚这个问题，有代表性的就是这个博客。论坛上有人解释了，但是年代久远，我这里把它捞出来。答主是这位。内容如下：创建排序视图的企图本身就是错误的，因为视图表示一个表，而表是不会对行排序的。众所周知，在SQLServer2000中追求排序视图的开发人员会利用貌似系统漏洞的一个技巧。利用这个漏洞可以创建一个非常可笑的视图，在该视图中，指定TOP100PERC...

2019-10-30 10:52:14 6518

原创内存分页管理FIFO中的belady现象

看了很多讲belady现象的文章，包括英文网页，都用的是下面一个例子：第一行是页面访问顺序，接下来几行是内存中的页面，第二行是最先进入内存的，空白就是运行初期还没有页面进入。但是仔细看就发现，多的那一次其实就是加载的时候多的，因为4页的要加载4页，当然多一次中断。后边正常运行，显然是4页的有优势。我不明白就这么点微弱的劣势为何会专门命名，好像很重要一样。当然这个微弱劣势可以被放...

2019-10-11 19:28:14 1826 2

原创文法和语言的形式描述词法分析 - 编译原理

先解释几个单词便于记忆。在 G(V_N, V_T, P, S) 中非终结符 nonterminal symbol终结符 terminal symbol产生式 production接下来我以正则表达式为实例来解释编译原理的一些东西，因为编译原理太过抽象，初学者没有实例可以类比，难于理解。我只解释难理解的一部分，还需要对照书本来看。非终结符是可推导的：比如正则表达式中 *,+ 这些，可以代...

2019-10-10 21:06:31 1831

翻译超宽深度网络和神经正切核 Ultra-Wide Deep Nets and Neural Tangent Kernel (NTK)

(也发布在at CMU ML.)作者：Wei Hu and Simon Du机器学习的传统观点认为，在训练误差和泛化差距之间要进行谨慎的权衡。模型的复杂性存在一个“最佳点”，因此模型（i）足够大，可以实现合理良好的训练误差，而模型（ii）足够小，可以泛化差距-测试误差和训练误差之间的差-可以控制。较小的模型会产生较大的训练误差，而使模型变大则会导致较大的泛化差距，两者都会导致较大的测试误...

2019-10-05 19:27:37 4979

原创自动操作软件获取软件按钮内容 UIAutomation 软件自动化测试（我的一点补充）

近期玩了下 UIAutomation。C# 中有 UI Automation 库，C++可以看msdn的Accessibility。这两个东西网上能找到的东西太少了，只能自己看微软的官方文档。我把我的一些代码段贴到下面，希望能帮助需要的人。Python有个库 UIAutomation，就是封装微软提供的 UIAutomation，网上有一些资料。但是这个库的作者说没有准备文档，所以需要的人自己...

2019-09-22 13:30:13 7467

翻译如何用Python编写拼写校正器（拼写检查器）

2007年的一个星期，两位朋友（迪恩和比尔）独立告诉我，他们对谷歌的拼写纠正感到惊讶。输入类似[speling]的搜索，Google会立即显示结果： spelling。我认为Dean和Bill是高度成熟的工程师和数学家，他们对这个过程的运作方式有很好的直觉。但他们没有，并且想到它，为什么他们应该知道迄今为止他们的专长？我认为他们和其他人可以从解释中受益。工业强度的纠正器的全部细节非常复杂（你可...

2019-09-15 08:15:05 1410 2

原创 python文件路径有空格和tkinter canvas加载图片的处理

汇总一下今天解决这个问题的一些方法：import subprocesssubprocess.call(['C:\\Temp\\a b c\\Notepad.exe', 'C:\\test.txt'])这是可以带参数的一种。subprocess.run(['C:\Program Files\Common Files\microsoft shared\ink\TabTip.exe'],s...

2019-09-12 20:31:24 754

翻译发现贝叶斯的乐高积木

原文：https://towardsdatascience.com/https-medium-com-hankroark-finding-bayesian-legos-part1-b8aeb886afba照片来源：FrédériqueVoisin-Demery / Flickr（CC BY 2.0）我有一个很好的朋友Joe，本周路过他家时我顺便造访了他家。像平常一样，我们聊了天气...

2019-05-20 17:01:23 448

翻译 GAN与自动编码器：深度生成模型的比较

原文：https://towardsdatascience.com/gans-vs-autoencoders-comparison-of-deep-generative-models-985cf15936ea想把马变成斑马吗？制作DIY动漫人物或名人？生成对抗网络（GAN）是您最好的新朋友。“Generative Adversarial Networks是过去10年机器学习中最有趣的想法。...

2019-05-20 17:01:05 5904

原创 python3装饰符@学习及实现函数输入参数的类型检查

在网上看了几篇文章，要么解释不清，要么代码运行不了。综合几篇文章，排完代码的坑，分享一下。不带参数的单一使用先声明这段代码我没运行，因为比较简单，看看就行了。def spamrun(fn): def sayspam(*args): print("spam,spam,spam") fn(*args) return sayspam@spa...

2018-12-03 10:26:58 746

原创 vim如何将另一个文件的特定行粘贴到本文件

我不喜欢用vi开多个文件，因为那会挤压我的屏幕空间。我一般在多终端中运行多个vi。这样为了跨终端粘贴，只能依靠终端的命令。 vi可以将linux命令执行结果粘贴到特定位置：一、将命令结果插入文件：运行 :r！command ， command命令的结果插入光标下一行 :nr! command, command命令的结果插入n行后。二、...

2018-11-30 09:19:00 3446

原创对cifar10.py中两个地方的理解

import tensorflow as tfw = tf.constant(1.0)b = tf.constant(4.0)def myGraph(w,b): tf.add_to_collection("loss",w) tf.add_to_collection("loss",b) w=tf.add(w,1.0) b=tf.add(b,1.0) ...

2018-11-29 19:42:42 200

原创对于ResNet残差网络的理解和思考

增加网络层数却导致更大的误差，如下图。这种deep plain net收敛率十分低下。原因：观察这张图可以看出，训练过程中两者的下降模式是差不多的，只不过56-layer的图像更“高”。也就是起点不好：初始化的时候，他需要生成56层随机数，结果能好吗？之所以这样能解决退化问题，我认为是，跨层连接降低了被跨层的重要性。深度可以提高准确率，却降低了泛化能力。使用更多的卷积核，降低深度，泛化会更好？...

2018-06-28 19:46:21 2398

原创 tensorflow手册cifar10.py（alexnet，卷积神经网络）的一些理解

以下只写一些我花了点时间才理解的东西： 1、卷积tf.nn.conv2d()函数的理解：它其中有第二个参数是[filter_height, filter_width, in_channels, out_channels]。代码中第二次卷积，输入是64,输出也是64。他的意思是本层的每个卷积核都要对之前生成的64个图同时进行卷积。之前生成的64个特征图已经对一些简单特征进行了提取，这时再...

2018-06-26 19:29:27 602

原创 python list.append()的机制

l=[]s="525234543254"l.append(s)s="11952"l.append(s)#------------------------d={}d["000"]="111"l.append(d)d["000"]="222"l.append(d)这段程序的运行结果表明,append()的是内存地址,而不是说元素再复制一份....

2018-05-05 10:10:16 3272

RealVNC-apk

freerdp-apk

利用 requests模拟 selenium 驱动浏览器 文章代码无法执行

利用 requests模拟 selenium 驱动浏览器文章代码无法执行