- 博客(47)
- 问答 (1)
- 收藏
- 关注
原创 远程控制软件代码分享及AI写代码经验(兼容uos,支持Wayland,20250903)
对于使用国产电脑搭载UOS系统且面临网络限制(向日葵、todesk已经被禁用)的用户来说,远程访问可能面临一些困难。
2025-09-05 10:56:27
978
原创 omniparser v2 本地部署及制作docker镜像(20250715)
关于 omniparser v2 本地部署,网上资料不算多,尤其是对于土蔷内用户,还是有些坑的。
2025-07-15 20:35:43
1257
3
原创 下载Bing 网页的每日背景图并添加到系统壁纸库中的代码分享
使用 AI 助手编写自动化测试程序的一个问题是,AI 助手并不知道网页结构。本文中,我自己写了 xpath 并告知 AI 助手,指引 AI 助手理解任务。我在无头模式运行失败后,让豆包给我生成了测试代码(代码中被注释掉的部分)截屏,截屏里没有加载其他按钮。Bing 网页每天都有精美壁纸。请用Python编写一个程序,它能够自动访问必应网页,下载该网页上的每日图片,并把它加入Ubuntu系统的壁纸库中。2、鼠标悬停在如下元素上: xpath=3、鼠标点击下载按钮:xpath=4、保存图片并加入系统壁纸库。
2025-06-19 10:49:43
294
原创 PDF文件合并、删除特定页面的工具分享
为了应付日常使用,我用豆包写了一个PDF文件合并、删除特定页面的工具。- 选择文件区域下方是“开始合并”按钮。合并完成后弹出合并后的文件已保存的提示框。最明显的就是整个窗口的大小,他最初设置的不对,隐藏了一些按钮。- 选择文件区域与“开始合并”按钮合属于一个操作区。- 待删除页码输入框支持一次输入多个页码,中间用“,”隔开。- 界面上方是一个选择PDF文件的区域。- 页面删除操作区包含一个待删除页码输入框、“删除”按钮.点击“删除”按钮后保存。用 python 编写一个PDF合并、删除特定页面的工具。
2025-06-12 16:43:29
554
原创 Ollama单聊非流输出python代码分享及工单检查任务 / prompt的经验(20250215)
2、Qwen1.5 这种不带 CoT 的,prompt 不能写的太隐晦。还有数字处理问题,可以把60分、90分换成“合格”、“优秀”之类的词汇。需要复杂分析的,可以交给 Qwen2.5 之类带 CoT 的。1、考虑到成本问题,像 deepseek 之类的带 CoT 就没必要了。我是用 Qwen1.5 做第一遍过滤,Qwen2.5 做进一步思考,这样整个流程会快一些。不知是不是网上错误代码多的原因,导致AI 被污染,我用 AI 写代码总是出错。由于我处理的是批量工单数据,所以单次聊天、非流式输出就够用了。
2025-02-28 15:20:12
481
原创 国产系统 麒麟/UOS 用 python 从局域网共享文件夹复制文件(20250225)
2、smbclient 命令。用 python os 库执行 smbclient 命令时,如果有多条的话,构造起来偏复杂。代码中注释了需要执行的几条命令,可以现在命令行尝试是否成功,再用 python 代码执行。总是出错,而且很难排查。所以还是 mount 命令比较方便。
2025-02-25 09:50:36
705
原创 用 Python 给 Excel 表格截图(20250207)
我搜索了网络上的方案,感觉把 Excel 表格转换为 HTML 是比较顺畅的路径,因为有顺畅的工具链。如果使用的是 Windows 系统则不需要阅读此文,因为 win32com 库更方便。这篇文章中 Excel 转 HTML 的方案,主要弥补了网上其他方案中存在合并单元格的情况。代码为智谱清言帮助生成,有些变量控制还是需要自己改一下。
2025-02-07 17:23:29
646
原创 playwright 自动化操作含有多个查询条件页面的代码分享(20241210)
镜像地址可能发生变化,还是按照我上面说的调试 xpath 的方法,先输入前一段 url 然后逐步延长,根据网站返回的消息逐步构造出完整的 url。2、时间选择控件的xpath 比较长,下面代码里包含了我的调试方法,就是逐步打印出来看是否找到正确的 DOM ,逐步延长xpath路径,直至找到我需要的DOM。填文本的功能写在一个代码段,时间选择的又是一个代码段。其他使用 Vue 写的页面,时间选择控件、树形结构选择的控件应该类似,所以可以参考这个案例。阅读代码时,可以先看所有的函数名,应该能猜到代码架构。
2025-01-12 21:02:23
338
原创 Python代码实现发送网易163邮箱邮件 - 含图片(20241205)
网上参考了很多今年发的相关文章,都是失败的。首先在163邮箱里开启IMAP/SMTP 服务,获取授权码。
2024-12-05 15:31:18
715
2
原创 Windows换机华为擎云(银河麒麟V10+麒麟9000C CPU)后,使用selenium的程序怎么办(20241030)
首先,playwright 在安装时,只需一条简单的命令即可自动选择合适版本的支持环境,Chrome、firfox、edge 都支持。微软的产品能力还是很强的。而且为了系统稳定,原来的版本最好保留。Firefox有一个geckodriver版本与Firefox版本的对照表,我看了一下,感觉他们是始终跟进新技术的。银河麒麟的很多库都是几年前的,如果要升级,就要升级一大批,不升级的话,想让多个库相互匹配,感觉工程量也不小。edge 驱动我试了一下,老是不识别,找了半天没找到原因,我也放弃了。
2024-11-04 16:17:34
2705
原创 华为擎云(银河麒麟V10+麒麟9000C CPU)电脑总是弹出“选择新密钥环的密码”(20241030)
麒麟系统用的是 Gnome 桌面。这个“密钥环”的弹出框是由 gnome-keyring-daemon 弹出的。这是一个管理密码的服务。类似于手机上,当你打开一个软件,系统自动就把密码填进去了。台式机上必要性不大。所以,最简单粗暴的方法就是卸掉他。当然也可以配置自动登陆。好像是使用PAM模块。不知道为什么,这对我的这台电脑并不可行。
2024-11-04 16:14:17
2815
原创 可以自动点击网页按钮的 Chrome 插件(manifest_v3 20241008)
2、本项目涉及到的这个 vue 单页应用的网址中是包含“#”号的。在 manifest.json 配置文件中,想在网址中填带“#”的网址也是没用的,插件不支持。1、调试时 background.js 的 console.log 的输出可以在浏览器插件页面(如下图的按钮点进去)中看到。content-script1.js 的日志输出是在网页打开后,打开“开发者工具”的控制台,里面可以看到。分享那个这个案例的意义在于,vue 单页应用不同于一般的网页,他有很多事件是不触发的,需要自己想办法处理。
2024-10-08 21:03:03
4587
原创 QtWebEngine automation 自动化操作
早期版本的 QtWebkit github 上有 Cisco 的 automation 开源项目。Qt 后来采用的 QtWebEngine 我搜了很多英文网页也没有成熟框架。只有通过其他方法曲线解决了。1、记住鼠标点位(电脑屏幕取点工具),用 pyautogui 去点击。2、分析网络协议。使用工具 ecapture ,只能在 linux 下运行。3、在加载的页面里,打开调试窗口,输入JavaScript 代码。4、图像识别,paddleOCR 识别文字效果很好,再结合 opencv 检测文.
2022-04-24 11:03:27
5715
原创 百度智能云NLP的使用及文本相似度
百度智能云API 接口的使用应该说是很方便的。但是网上代码资源不多,还有运行不了的代码,误导了我很久。在此发文一篇,分享2021年12月30日可运行代码,并实现了对比两段事件描述相似度的功能。import json,requests,os,refrom openpyxl import load_workbookfrom time import sleepimport numpy as npAPIKey='*****'SecretKey='*****'#创建请求urldef get_A
2021-12-30 18:09:28
1590
原创 Faster-RCNN 入门(也包含 Fast RCNN 的技术)
本文集合了 Faster-RCNN 的关键技术,了解 CNN 以后就可以看本文。SelectiveSearch目标检测物体的候选框是如何产生的? 如今深度学习火热的今天,RCNN/SPP-Net/Fast-RCNN等文章都会谈及bounding boxes(候选边界框)的生成与筛选策略。那么候选框是如何产生,又是如何进行筛选的呢?其实物体候选框获取当前主要使用图像分割与区域生长技术。区域生长(合并)主要由于检测图像中存在的物体具有局部区域相似性(颜色、纹理等)。目标识别与图像分割技术的发展进一
2020-07-11 10:42:00
1146
原创 微信小程序加载动画
补充一下这篇文章 里的第二个例子的代码。wxml 文件:<view class="tui-loading-row"> <view class="tui-loading-cell"> <!--第一个动画,省略,见原文章--> </view> <view class="tui-loading-cell"> <view class="circle-line-spin" > <tex...
2020-06-10 20:10:04
2149
原创 Ubuntu 安装 Android Studio 全过程记录(2020年1月)
不同时期,不同版本安装方法也不同。这是我在2020年1月的安装过程。版本 lubuntu 18 + jdk8_202 + Android Studio 3.5.31.安装jdk先下载 jdk8 地址:下载 jdk下载完以后运行安装:sudo update-alternatives --install "/usr/bin/java" "java" "/jdk/jdk...
2020-02-22 20:31:06
3559
原创 wxPython Grid 表格控件的使用
因工作原因使用了一下 wxPython。总的来说不推荐。我的观点是干什么事情,要用那个领域最成熟的库,比如桌面软件,用 C#、Qt。不流行的的 wx 有 bug,参考文档少。下面贴出我的代码。这个代码展示了 Grid 的使用,可以“增删改”,按列排序,隐藏某一列的显示(就像在 Excel 里为了看东西方便)。界面设计可以先用 wxFormBuilder 设计好,把代码 copy 过来。有些问题不好...
2020-01-12 16:05:29
8601
原创 对 Capsule Network 的理解
先推荐一篇对胶囊网络讲解很详细的 文章。Capsule Network 很重要的是解决了如果一张图片中,鼻子眼睛的位置是错的,如何识别出它不是一张脸的问题。那么我们来思考一下它为什么有这个能力?在最后一层的 10*16 矩阵中,假设 16 个数代表鼻子或者眼睛中的一个东西,那么两个数对调,模型结果会变化吗?不会。因为后边接的是全连接网络,和普通的 CNN 没什么区别,你把这 16 个数全打...
2019-12-21 11:08:43
625
原创 SQL语句创建视图为什么不能用order by
很多地方都没解释清楚这个问题,有代表性的就是这个博客。论坛上有人解释了,但是年代久远,我这里把它捞出来。答主是这位。内容如下:创建排序视图的企图本身就是错误的,因为视图表示一个表,而表是不会对行排序的。众所周知,在SQLServer2000中追求排序视图的开发人员会利用貌似系统漏洞的一个技巧。利用这个漏洞可以创建一个非常可笑的视图,在该视图中,指定TOP100PERC...
2019-10-30 10:52:14
6491
原创 内存分页管理FIFO中的belady现象
看了很多讲belady现象的文章,包括英文网页,都用的是下面一个例子:第一行是页面访问顺序,接下来几行是内存中的页面,第二行是最先进入内存的,空白就是运行初期还没有页面进入。但是仔细看就发现,多的那一次其实就是加载的时候多的,因为4页的要加载4页,当然多一次中断。后边正常运行,显然是4页的有优势。我不明白就这么点微弱的劣势为何会专门命名,好像很重要一样。当然这个微弱劣势可以被放...
2019-10-11 19:28:14
1807
2
原创 文法和语言的形式描述 词法分析 - 编译原理
先解释几个单词便于记忆。在 G(V_N, V_T, P, S) 中非终结符 nonterminal symbol终结符 terminal symbol产生式 production接下来我以正则表达式为实例来解释编译原理的一些东西,因为编译原理太过抽象,初学者没有实例可以类比,难于理解。我只解释难理解的一部分,还需要对照书本来看。非终结符是可推导的:比如正则表达式中 *,+ 这些,可以代...
2019-10-10 21:06:31
1812
翻译 超宽深度网络和神经正切核 Ultra-Wide Deep Nets and Neural Tangent Kernel (NTK)
(也发布在at CMU ML.)作者:Wei Hu and Simon Du机器学习的传统观点认为,在训练误差和泛化差距之间要进行谨慎的权衡。模型的复杂性存在一个“最佳点”,因此模型(i)足够大,可以实现合理良好的训练误差,而模型(ii)足够小,可以泛化差距-测试误差和训练误差之间的差-可以控制。较小的模型会产生较大的训练误差,而使模型变大则会导致较大的泛化差距,两者都会导致较大的测试误...
2019-10-05 19:27:37
4911
原创 自动操作软件 获取软件按钮内容 UIAutomation 软件自动化测试(我的一点补充)
近期玩了下 UIAutomation。C# 中有 UI Automation 库,C++可以看msdn的Accessibility。这两个东西网上能找到的东西太少了,只能自己看微软的官方文档。我把我的一些代码段贴到下面,希望能帮助需要的人。Python有个库 UIAutomation,就是封装微软提供的 UIAutomation,网上有一些资料。但是这个库的作者说没有准备文档,所以需要的人自己...
2019-09-22 13:30:13
7384
翻译 如何用Python编写拼写校正器(拼写检查器)
2007年的一个星期,两位朋友(迪恩和比尔)独立告诉我,他们对谷歌的拼写纠正感到惊讶。输入类似[speling]的搜索,Google会立即显示结果: spelling。我认为Dean和Bill是高度成熟的工程师和数学家,他们对这个过程的运作方式有很好的直觉。但他们没有,并且想到它,为什么他们应该知道迄今为止他们的专长?我认为他们和其他人可以从解释中受益。工业强度的纠正器的全部细节非常复杂(你可...
2019-09-15 08:15:05
1378
2
原创 python文件路径有空格和tkinter canvas加载图片的处理
汇总一下今天解决这个问题的一些方法:import subprocesssubprocess.call(['C:\\Temp\\a b c\\Notepad.exe', 'C:\\test.txt'])这是可以带参数的一种。subprocess.run(['C:\Program Files\Common Files\microsoft shared\ink\TabTip.exe'],s...
2019-09-12 20:31:24
733
翻译 发现贝叶斯的乐高积木
原文:https://towardsdatascience.com/https-medium-com-hankroark-finding-bayesian-legos-part1-b8aeb886afba照片来源:FrédériqueVoisin-Demery / Flickr(CC BY 2.0)我有一个很好的朋友Joe,本周路过他家时我顺便造访了他家。像平常一样,我们聊了天气...
2019-05-20 17:01:23
430
翻译 GAN与自动编码器:深度生成模型的比较
原文:https://towardsdatascience.com/gans-vs-autoencoders-comparison-of-deep-generative-models-985cf15936ea想把马变成斑马吗?制作DIY动漫人物或名人?生成对抗网络(GAN)是您最好的新朋友。“Generative Adversarial Networks是过去10年机器学习中最有趣的想法。...
2019-05-20 17:01:05
5875
原创 python3装饰符@学习及实现函数输入参数的类型检查
在网上看了几篇文章,要么解释不清,要么代码运行不了。综合几篇文章,排完代码的坑,分享一下。不带参数的单一使用先声明这段代码我没运行,因为比较简单,看看就行了。def spamrun(fn): def sayspam(*args): print("spam,spam,spam") fn(*args) return sayspam@spa...
2018-12-03 10:26:58
727
原创 vim如何将另一个文件的特定行粘贴到本文件
我不喜欢用vi开多个文件,因为那会挤压我的屏幕空间。我一般在多终端中运行多个vi。这样为了跨终端粘贴,只能依靠终端的命令。 vi可以将linux命令执行结果粘贴到特定位置:一、将命令结果插入文件: 运行 :r!command , command命令的结果插入光标下一行 :nr! command, command命令的结果插入n行后。二、...
2018-11-30 09:19:00
3420
原创 对cifar10.py中两个地方的理解
import tensorflow as tfw = tf.constant(1.0)b = tf.constant(4.0)def myGraph(w,b): tf.add_to_collection("loss",w) tf.add_to_collection("loss",b) w=tf.add(w,1.0) b=tf.add(b,1.0) ...
2018-11-29 19:42:42
177
原创 对于ResNet残差网络的理解和思考
增加网络层数却导致更大的误差, 如下图。 这种deep plain net收敛率十分低下。原因:观察这张图可以看出,训练过程中两者的下降模式是差不多的,只不过56-layer的图像更“高”。也就是起点不好:初始化的时候,他需要生成56层随机数,结果能好吗?之所以这样能解决退化问题,我认为是,跨层连接降低了被跨层的重要性。深度可以提高准确率,却降低了泛化能力。使用更多的卷积核,降低深度,泛化会更好?...
2018-06-28 19:46:21
2355
原创 tensorflow手册cifar10.py(alexnet,卷积神经网络)的一些理解
以下只写一些我花了点时间才理解的东西: 1、卷积tf.nn.conv2d()函数的理解:它其中有第二个参数是[filter_height, filter_width, in_channels, out_channels]。代码中第二次卷积,输入是64,输出也是64。他的意思是本层的每个卷积核都要对之前生成的64个图同时进行卷积。之前生成的64个特征图已经对一些简单特征进行了提取,这时再...
2018-06-26 19:29:27
583
原创 python list.append()的机制
l=[]s="525234543254"l.append(s)s="11952"l.append(s)#------------------------d={}d["000"]="111"l.append(d)d["000"]="222"l.append(d)这段程序的运行结果表明,append()的是内存地址,而不是说元素再复制一份....
2018-05-05 10:10:16
3259
利用 requests模拟 selenium 驱动浏览器 文章代码无法执行
2022-02-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅