- 博客(254)
- 收藏
- 关注
原创 [原创] ray raylet OOM
ray work 内存占用并不高. 客户端节点 raylet 内存占用也不高, 但是主节点的 raylet 内存持续性增长, 直到 OOM 整个服务异常.在用 ray 集群做数据处理时, 主节点 raylet 内存持续增长不释放.装饰的函数结束前, 确保使用。
2024-06-05 14:47:39 172
原创 [原创] pymongo collection count vs count_documents vs estimated_document_count
count_documents estimated_document_count
2024-01-05 15:01:55 479
原创 [原创] 使用 Ray 分布式计算框架读取 jsonl (json line)
使用 Ray 分布式计算框架读取 jsonl(json line) 格式文件.
2023-08-30 14:45:48 216
原创 【原创】Macbook 程序坞/任务栏/Dock 外接显示器自动切换的问题
网上有很多解答, 在屏幕最下方画拱形, 上下滑动, 拖到最下方等 2s, 使用快捷键切换自动隐藏等等, 都不是最佳答案. 因为只有偶尔会生效, 并没有找到问题的根源.实际上, 任务栏在主副屏幕切换的原因就是系统识别到光标在 Dock 边缘还在持续拖动. 这真的是 Feature (Bug).Macbook 双屏模式下, 任务栏经常自动切换到副屏.. 一定会触发, 复现率 100%.
2023-08-14 15:59:53 1327
原创 【原创】MLC LLM AI 本地部署
运行 build.py 或者 mlc_chat.rest 需要用 mlc_ai_nightly_cu121 或者 mlc_ai_nightly_vulkan的 libtvm.so 和 libtvm_runtime.so。需要注意,如果使用 mlc_chat_cli,需要用编译tvm后的 libtvm.so 和 libtvm_runtime.so.复制替换的方式不优雅,可以配置 LD_LIBRARY_PATH。
2023-06-11 14:54:21 1969
原创 ClickHouse Cluster vs PGPool
clickhouse cluster vs postgres pgpool cluster
2022-03-30 01:41:10 219
原创 Clickhouse Research Reports
FilterPostgresql(default) /msPostgresql(Index+view) /msClickHouse (default) /msClickHouse +table, index /msClickHouse Cluster /msTaxonomy (default)220171921343150Taxonomy (ngrams)574513621791122Taxonomy Score (default)656421...
2022-03-30 01:25:27 762
原创 Citus Test Report for Disk Usage
The test environmentpgsql-haservice namecpumemorydiskpgpool24HHD 200Gpg-master816HHD 500Gpg-slave1816HHD 500Gpg-slave2816HHD 500GdiagramCitus-hamasterservice namecpumemorydiskpgpool24HHD 200Gpg-ma
2022-03-30 01:08:49 277
原创 [原创] postgres auto reconnect自动重连
#!/usr/bin/python# -*- coding: utf-8 -*-# @Author: zhipeng# @Email: zhipeng.py@gmail.com# @Date: 2020-07-11 00:43:36# @Last Modified by: zhipeng# @Last Modified time: 2020-07-22 21:59:08from psycopg2.extensions import cursorfrom psycopg2 impor
2020-12-26 23:20:49 1548 1
原创 [原创] Docker - wvdial 拨号联通4G 搭建代理服务, 出口 IP 随机
接上篇, 树莓派使用多个联通4G上网卡> - http://blog.csdn.net/u012731379/article/details/78732774 本篇使用Docker 拨号联通4G, 并且搭建代理服务, 并且出口 IP 随机化. 解决多网卡拨号后需要配置路由表的问题.在 docker 中共享 device$ docker run -t -i --device=/dev/
2019-12-23 11:57:00 4150 5
原创 [原创]使用 swagger 定义 API
使用 Swagger 定义APIStart Swagger Editordocker run -d -p 8080:8080 swaggerapi/swagger-editorOpen Swagger Editor in browser http://localhost:8080/https://swagger.io/tools/swagger-editor/download/...
2019-07-09 19:21:27 621
原创 [原创] k8s 部署文档
k8s note, support all cni plugin.master firstinstall dockercurl -fsSL https://get.docker.com -o get-docker.shbash get-docker.shsystemctl enable docker && systemctl start dockerdocker ps...
2019-06-17 11:37:01 4066
原创 [原创]容器中使用 hostname 访问外部机器
容器中使用 hostname 访问外部服务AWS 上有一个集群服务, VPS 之间使用 ip-xx-xx-xx-xx 是可以直接访问的.现在有个需求, 要在某几台机器部署 docker, 在容器内访问集群内的服务. 并且使用 hostname 实现.# 创建 Dockerfilecat > Dockerfile << EOFFROM alpineEOF# 创建 d...
2019-05-21 15:52:24 2828
原创 [原创] python logging 将 debug info 级别输出到 stdout, error warning critical 输出到 stderr
将 logging debug/info 级别的日志输出到 stdout, 将 warning, error, critical 输出到 stderr.结果示例. 代码已经提交到 Stack Overflow 上. 详见: https://stackoverflow.com/a/55494220/3992791# 只输出 print/logging.debug/logging.info 内容...
2019-04-11 18:42:14 2395
原创 [原创] gitlab commit 集成 redmine issue
gitlab 集成 redmine issueweb 容器我使用的是 nginxnginx 配置目录 /etc/nginx/nginx.confnginx html 文件目录 /var/www/cgi/更改 nginx/redmine 进程运行用户启动 nginx 后, redmine 不会有任何进程. 当访问 redmine 后, 后台会 fork 一个子进程.ps aux|gre...
2019-01-29 14:20:28 2006
原创 [原创] python convert dict to object like javascript use munch(bunch)
python convert dict to object like javascriptinstallpip install munch# (munch clone from bunch, but bunch has not update long time)examplefrom munch import munchifyfrom munch import unmunchify...
2018-12-19 18:21:10 387
原创 [原创] python monitor log end content send to html use websocket
Use Python monitor log file end content, like tail -f, and send to html use websocket.server.py# server.pyimport tornado.webimport tornado.httpserverimport tornado.optionsfrom tornado.options ...
2018-09-13 17:28:15 238
原创 [原创] 调研 python json 提取工具
为便捷配置信息提取规则, 调研 json 格式的数据提取方案.jsonselect css selector 实现$ pip install jsonselect >>> import jsonselect as j>>> >>> data = {'name':'zz', 'books':[{'name':'x','pr...
2018-08-31 18:23:05 1252
原创 [原创] layer.js 实现自适应置顶消息流
使用 layer.js 实现只适应置顶消息流, 官网只提供了 API 可以指定, 但只能显示一个, 第二个会删除前一个消息框. 通过查看源码, 如果类型是 dialog, 会调用 closeAll(“dialog”), 清除之前所有的 [type=dialog] 消息框. 只需要将 type 设置不为 dialog 即可不被清除, 不影响超时淡出. https://github.com/se...
2018-08-27 19:23:54 1027
原创 [原创] 在已有 python2 代码快速实现协程. gevent grequests 协程效率对比
重新研究了一下 python 协程, 用 在 python2 中用 gevent/grequests 实现, 做了一些对比. 目的是想在 python2 的现有代码的基础上, 在改动量最小的前提下实现协程.grequests 也是用 gevent 实现的, 对 requests 进行了一些补丁修改.#! -*- coding:utf8import geventimport threa...
2018-08-02 18:14:26 782
原创 [原创] 记一次 ElasticSearch 问题查找 - 数据同步非常慢
开始是三个节点组成的集群, 后加了两台. 但是同步数据变的非常慢. 追查问题后发现是 ulimit 配置不当导致.$ curl 192.168.3.48:9200/_nodes/stats/process?filter_path=**.max_file_descriptors{ "nodes": { "bf79DOwKQ4GJxJcsIaFDqQ": { ...
2018-08-02 17:16:53 2190
原创 [原创] NAS iscsi 开机启动自动挂载
NAS 开机启动自动挂载. 局域网内有一台 NAS, 上面分了多块 Target, 多台机器都会使用这台 NAS, 但是发现 NAS 自动挂载有问题. 明明只在某台机器挂载了某一个 Target, 但所有机器重启之后, 这台机器上可能会挂载上别的 Target. (只是链接到这台机器, fdisk 可以看到, 没有实际挂载到某个目录), 所有导致别的机器不能正常挂载.所以只能保持 isc...
2018-07-25 11:25:20 5358
原创 【原创】elasticsearch 一些整理总结
16年公司检索系统是用的 solr, 但使用过程中发现太糟心, 十分难用- - 17年初换到 es. 把当时整理的知识点记录一下. 机器配置: 1台 centos, 2台 ubuntu. 内存: 64G, CPU: 8核 硬盘: 8TB(SAS, es 数据), 250GB(SSD, 系统) es 版本: 5.4.0数据量: 目前为止一共40亿数据 内存: jvm 分配31G, ...
2018-07-09 16:46:21 1328
原创 [原创] Python 让 SimpleHTTPServer 支持DELETE, 并且支持并发下载
将常有一些小需求搭建一个文件服务器下载数据, 大家一般都会用 python -m SimpleHTTPServer 但是这样有个问题, 这样是阻塞模式. 多个人下载文件时, 如果有一个人在下大文件, 后面的人就会一直等待响应.# 查看 SimpleHTTPServer 源码# lib/python2.7/SimpleHTTPServer.py def test(HandlerCla...
2018-06-06 17:24:58 1636
原创 【原创】Nominatim 快速部署/备份还原(PGSQL 数据库文件)
nominatim 物理迁移, 其实是迁移 PGSQL 的数据库文件. 因为 nominatim 数据库文件少则几个GB, 多则几百 GB. 如果每次部署都使用 setup.php 进行导入, 时间非常慢. 测试 1.5MB 的马尔代夫地理信息 pbf 文件, 整个入库用了5分钟. (测试机用的1核1G, 不过1.5MB 用5分钟实在有点过分) 使用物理备份恢复, 脚本可以做到一键且秒级恢复...
2018-05-15 12:31:27 1461 1
原创 [原创] RavenDB 安装 使用
RavenDB 安装/使用上一篇文章介绍了 CouchDB, 这篇文章介绍一下 RavenDB安装使用. RavenDB 也是支持对记录做版本管理的数据库. 默认是不支持的, 需要手动设置. 官网: https://ravendb.net RavenDB Github: https://github.com/ravendb/ravendb RavenDB-python Github: htt
2018-04-11 18:40:42 2084 1
原创 [原创] couchdb 安装/使用
couchdb 安装/使用 需求: 要对数据库中的记录做版本管理. 通过调查, 排除了 es, mongodb, couchBase, ravendb 最终选用了 couchdb. 之所以选用 couchdb, 是因为 couchdb 是支持对文档所版本管理. 而且默认查询可以使获取最新版本记录. es 的 version 仅做记录用, 旧版本的数据不可查, 并且会在特...
2018-04-09 20:30:07 4176
原创 [原创] elasticsearch 导出工具 elasticdump
// 日志记录 2017-11 项目是 node 写的, 依赖 nodejs, https://www.npmjs.com/package/elasticdump GitHub 地址: https://github.com/taskrabbit/elasticsearch-dump备份文件elasticdump --type=data --input="http://localhost:9200
2018-04-08 18:46:37 10523
原创 [原创] 前端 diff 文本 - mergely
介绍需要前端展示文本编辑历史, 并做 diff. 找了三个库, 分别是: CodeMirror, DiffMatchPatch, Mergely CodeMirror 效果不是很好, DiffMatchPatch 是 Google 开发的, 感觉实现后效果同样不好.最后选用了 Mergely. 实际上, Mergely 用到了 CodeMirror, 而 CodeMirror 用到...
2018-04-08 11:37:56 9395 11
原创 [原创] 即时编辑 html JQuery 库 - Jeditable
官网地址: https://appelsiini.net/projects/jeditable/ Github 地址: https://github.com/NicolasCARPi/jquery_jeditable这是实现的仅仅是修改 HTML 的展示, 所以不需要发请求提交更改. editable 第一个参数设置为 function 即可替换默认的函数.示例<h...
2018-03-27 11:41:41 1149
原创 [原创] 嵌入式浏览器 使用 nw.js 打包windows 版的嵌入式浏览器 移动桌面应用
嵌入式浏览器调研CEF (Chromium Embedded Framework) : https://bitbucket.org/chromiumembedded/cefnw.js(Chromium/Node.js) https://github.com/nwjs/nw.jsHEX(CEF) https://github.com/netease-youdao/hexelectron...
2018-03-06 18:37:09 2839
原创 [原创] 树莓派 shell 重启 USB 设备
在树莓派上用 shell 重启 usb 设备cd /sys/devices/platform/soc/echo 0 > buspower; sleep 10; echo 1 > buspower;
2018-01-26 13:03:40 1885 2
原创 [原创]解决Chrome dev 模式下 调试插件的问题
Debug 网页的时候, 如果 Chrome 安装了一些插件, Chrome 会对这些插件也进行 Debug, 尤其是一些周期性的 JS 代码. 网上解决办法都是屏蔽某一个, 其实可以屏蔽全部. 打开 dev tool, 再打开设置(F1), 在 blackboxing 加入一项: ^chrome-extension://.*\.js$ 即可忽略所有拓展程序. 还以用正则过滤某个子域名, UR
2018-01-11 19:03:27 1250
原创 [原创]Python 运行 shell 获取输出结果
首先使用内置模块os.>>> import os>>> code = os.system("pwd && sleep 2")# /User/zhipeng>>> print code# 0 问题是 os.system 只能获取到结束状态使用内置模块 subprocess>>> import subprocess>>> subprocess.Popen("pwd && sleep 2"
2017-12-20 18:40:23 14008
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人