- 博客(274)
- 收藏
- 关注
原创 运筹系列93:VRP精确算法
MTZ是Miller-Tucker-Zemlin inequalities的缩写。除了定义是否用到边xij外,还需要定义一个ui用来表示此时车辆的当前载货量。注意这里x变量需要定义为有向。MTZ的求解速度不快,10个点3辆车都需要3秒左右时间。
2024-06-24 14:08:22
464
原创 收音机的原理笔记
人类听觉范围为20 Hz-20 kHz,多数人声的频率范围在340 Hz到3.4KHz之间。收音机的基本架构如下图所示,天线接收电波信号,通过输入调谐选出所需的频带。其经过高频放大后,由检波电路分离出音频信号,再经过音频功率放大器进一步放大,驱动喇叭发出声音。我们不直接传输信号,而是将信号叠加到载波上。载波,是一种运载声音信号的高频波,本身不传递有效信息,但频率很高,可以被天线正常接收到。无线电广播:将原来用电线传输的信号转化为电磁波,通过信号塔发送,听众只需安装天线接收电信号即可。
2024-06-11 08:10:59
364
原创 python系列29:压测工具locust
然后打开web页面:点击start,会执行脚本代码,调用hello和world接口。ramp-up的设置,一般而言:100以内的并发用户数,ramp-up时间设置为1-2s;100-500左右,rramp-up时间设置为2-3s;500以上,ramp-up时间设置为5-10s。
2024-06-03 10:52:14
712
原创 深度学习系列68:声音克隆项目OpenVoice和FishSpeech
OpenVoice 是 myshell ai 开源的一款基于人工智能技术的语音克隆工具。其核心功能是通过提供发言者的短音频片段(参考语音),实现声音的高效克隆。这意味着您可以使用OpenVoice来克隆任何人的声音,而且不限于特定语言。无论您是想要模仿某位名人的声音,还是需要在不同语言之间进行语音转换,OpenVoice都能够满足您的需求。OpenVoice还可以实现音色克隆和控制。
2024-05-14 10:27:13
506
原创 运筹系列92:vrp算法包VROOM
详见:https://github.com/VROOM-Project/vroom/blob/master/docs/API.md需要定义如果没有指定经纬度和地图server的话,则需要定义matrices。
2024-05-13 15:01:15
784
1
原创 深度学习系列67:制作聊天机器人
tresponse = requests . post ( url , headers = headers , json = data , verify = False )if response . status _ code ==200:return response . json ()[" choices “][0][” message “][’ content ‘]else :return “我没有听清”async def read ( text ):tts = edge _ tts .
2024-04-24 16:58:43
1061
1
原创 深度学习系列64:数字人wav2lip详解
总体步骤差不多,但是相比于openHeygen要简化很多第一步,加载视频/图片和音频/tts。同样是用melspectrogram将wav文件拆分成mel_chunks。第二步,调用face_detect模型,给出人脸检测结果(可以改造成从文件中读取),包装成4个数组batch:img_batch(人脸),mel_batch(语音),frame_batch(原图),coords_batch(坐标)第三步,加载模型,进行计算。这个模型目前看下来就是简单的resnet,没有transfomer。
2024-04-23 13:32:01
1559
原创 深度学习系列65:数字人openHeygen详解
从inference.py函数进入,主要流程包括:1) 使用cv2获取视频中所有帧的列表,如下:2)定义Croper。核心代码为69行:full_frames_RGB, crop, quad = croper.crop(full_frames_RGB)。其中crop是头肩位置,quad是人脸位置,得到的新的full_frames_RGB为人脸区域的截图。5)进行图像增强,使用的是GPEN-BFR-512模型,图片变高清了:6)接下来加载wav语音文件,并拆成块7)进行lipSync,如下图。
2024-04-21 20:46:54
696
原创 运筹系列90:生产线运输问题的julia求解
我们不妨假设仓库有3种物料需要搬运到生产线,搬运时间都是3min。三种物料假设都需要搬运3件,有2个叉车可以进行搬运,每个叉车每次智能搬运一件。
2024-04-10 08:16:34
222
原创 深度学习系列63:常用tts
使用sherpa的参考代码如下,模型下载地址见https://hf-mirror.com/csukuangfj/vits-zh-aishell3。
2024-03-22 09:56:35
523
原创 深度学习系列62:Agent入门
agent的核心是其代理协同工作的能力。每个代理都有其特定的能力和角色,你需要定义代理之间的互动行为,即当一个代理从另一个代理收到消息时该如何回复。agent目前大多使用openai标准接口调用LLM服务,说明如下。标准接口示例如下,其中role包括:system(设定了 AI 的行为和角色,和背景),user(我们输入的问题或请求),assistant(自动生成)
2024-03-13 11:02:46
644
原创 深度学习系列59:文字识别ocr
使用google加的tesseract,效果不错。首先安装tesseract,在mac直接brew install即可。
2024-02-21 20:23:40
724
原创 运筹系列89:anylogic仿真软件入门
这里概述一下help文档中Supply chain GIS model例子的要点:触发事件的agent和执行任务的agent。在这个案例中,触发事件的agent是retailer,不断有订单生成;而执行任务的agent是vehicle,不断将订单运从distributor运送到retailer。模型的最终效果如下图:首先需要设计agent。在供应链的例子中,设计了4种agent。其中dis和order最简单,order就是个classret需要包含一个,用于生成order,寻找veh。
2024-02-20 09:28:13
1035
原创 深度学习系列53:大模型微调概述
固定大部分参数,仅训练少量的参数来驱动大模型。下图是delta-tuning和fine-tuning的区别。左边的fine-tuning中,每个任务都全量微调,得到一个新的模型,如果有100个任务,那么最终会给出100个数十G的大模型;但是在delta-tuning中,PLM参数大部分是固定的,每个任务只需要训练和记录有修改部分的参数(delta-object)即可。delta-tuning分为以下三大类:增加额外参数(A)、选取一部分参数更新(S)、引入重参数化(R)。
2024-02-17 18:32:17
1344
原创 深度学习系列57: 清华大模型MiniCPM上手
MiniCPM 是面壁智能与清华大学自然语言处理实验室共同开源的系列端侧大模型,主体语言模型 MiniCPM-2B 仅有 24亿(2.4B)的非词嵌入参数量。
2024-02-04 16:38:26
915
原创 python系列28:fastapi部署应用
FastAPI 是一个用于构建 API 的现代、快速(高性能)的 web 框架,类似flask,Django,webpy在部署时可能需要用到下面的库:Uvicorn 或者 Hypercorn负责ASGI 服务器。Starlette 负责 web 部分。Pydantic 负责数据部分。都用pip install安装即可。
2024-01-15 13:59:26
747
原创 Julia系列16:Julia与python/c互调
通过PyCall包,Julia可以直接调用Python包。数值、布尔、字符串、IO stream、函数、元组、数组或列表、以及包含这些类型的字典等,它们都会自动进行类型的转换(Python函数会被转换或传递为Julia的函数,反之亦然)。其它类型则是通过通用的PyObject提供的。
2024-01-15 12:41:14
594
原创 运筹系列88:JuMP中的约束规划(constraint programming)
在constraint programming中,objective是不起作用的,调用optimize!(model)后,会给出满足约束的可行解。使用JuMP的约束规划API,可以极大简化模型。
2024-01-10 15:34:13
1059
原创 运筹系列87:julia求解随机动态规划问题入门
看一个简单的数值优化的例子:我们将其建立为一个N阶段的问题:初始值为M。结果为非常接近理论最优值。
2023-12-18 11:17:35
1218
原创 大数据系列15:lightgbm笔记
建议用conda安装。首先安装miniconda,在官网下载对应的版本。然后将系统的python和pip定位到miniconda文件夹下。然后用conda安装lightgbm,在Mac m2芯片上测试可行。(用pip直接安装通不过编译)。
2023-11-24 08:36:19
710
原创 深度学习系列54:LABEL-STUDIO进行半自动化目标检测标注
打开浏览器访问 http://localhost:8080/ ,建立一个新项目。此时不要着急save,需要先点击后面的Labeling Setup连接第一步的目标检测服务。看到如下 Connected 就说明后端推理服务添加成功。在mmdetection文件夹中,执行。另开一个terminal,执行。
2023-11-20 09:39:36
759
原创 深度学习系列53:mmdetection上手
建议使用coco格式,参见https://cocodataset.org/#format-data。文件从头至尾按照顺序分为以下段落:下面是从instances_val2017.json文件中摘出的一个annotation的实例,这里的segmentation就是polygon格式:“id”: 1768},从instances_val2017.json文件中摘出的2个category实例如下所示:“id”: 1,},“id”: 2,},
2023-11-19 08:37:03
871
原创 深度学习系列52:多目标跟踪
1)FP:False Positive,即真实情况中没有,但跟踪算法误检出有目标存在。2)FN:False Negative,即真实情况中有,但跟踪算法漏检了。3)IDS:ID Switch,目标ID切换的次数。4)MOTA: Multiple Object Tracking Accuracy,多目标跟踪准确度。5)IDF1: ID F1得分,正确身份标签赋予的检测框与平均ground truth和计算的检测数量的比值。6)MT:Mostly Tracked,大多数目标被跟踪的轨迹数量。
2023-10-24 14:23:58
334
1
原创 运筹系列86:MIP问题的建模tips
添加辅助变量y。比如Either3x12x2≤18orx14x2≤16可以用3x12x2≤18Myx14x2≤16M1−y来代替。
2023-10-19 19:01:09
326
原创 深度学习系列51:hugging face加速库optimum
Optimum是huggingface transformers库的一个扩展包,用来提升模型在指定硬件上的训练和推理性能。Optimum支持多种硬件,不同硬件下的安卓方式如下:如果是国内安装的话,记得加上-i https://pypi.tuna.tsinghua.edu.cn/simple。hugging face目前是被墙的状态,在使用示例代码时,需要将模型离线下载下来使用。
2023-10-13 14:31:59
947
原创 批量下载微信公众号要点
参考GitHub 项目vWeChatCrawl,详细步骤见https://zhuanlan.zhihu.com/p/375046671,这里说下注意事项。
2023-09-15 09:36:44
250
原创 运筹系列85:求解大规模tsp问题的julia代码
关于列生成的列子,可以参考《运筹系列8:Set partitioning问题的列生成方法》。我们这里使用priority queue存储分枝节点,按照最简单的下标顺序,对所有非整数变量进行分枝。求解主问题,然后找到检验数
2023-09-07 18:09:42
303
原创 运筹系列84:使用reduced matrix法求解tsp问题
我们得到reduce cost,可以作为tsp的lb = (10 + 10 + 15 + 20 + 5 + 10) = 70。我们用行表示从每个点出去的距离,用列表示从每个点进来的距离。
2023-08-31 09:36:15
288
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人