自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

文火冰糖(王文兵)的博客

文火:深耕细作,方得始终;冰糖:甜而不腻,剔透浑厚。

  • 博客(6098)
  • 资源 (25)
  • 问答 (1)
  • 收藏
  • 关注

原创 寻找创业伙伴,共同探讨技术生活,用技术创造价值。我的标签:嵌入式系统、通信、人工智能、项目管理、理财、创业、心理学

扫描如下二维码即可关注我的微信

2020-09-12 17:30:04 6589 17

原创 [具身智能-636]:什么是语音识别?语音识别的技术过程?语音于语音特征提取?什么环节实现时域到频域的转化?

把,自动转换成的技术。。不关心声音多好听,只关心。

2026-05-10 10:16:00 2

原创 [具身智能-635]:不同常规音频文件,差别在于对数据的压缩,但都是时域波形

常规音频文件只是时域波形的不同打包压缩格式,全都不保存独立频域特征;频域是后期对时域 PCM 做 FFT 算出来的,不是录音存下来的。

2026-05-10 10:02:58 2

原创 [具身智能-634]:语音全链路:通道 → PCM 编码 → 传输格式 → 存储格式 → WAV 文件

同一时刻同时采集几路语音信号。单声道 Mono:1 路麦克风,语音 AI、嵌入式、机器人默认只用这个立体声 Stereo:2 路左右声道,听歌用,语音识别不用多通道阵列:4 麦 / 6 麦 / 8 麦阵列(PDM/TDM),用于声源定位、降噪、远场唤醒做人机语音、离线识别、传感器采集 →固定 单声道 1 通道固定 单声道 1 通道16k 16bit 单声道 PCM传输:近场 I2S、多麦阵列 PDM、省事用 USB中间处理 / 算法输入:存PCM 裸流调试 / 给人播放 / 归档:存WAV。

2026-05-10 09:57:02 3

原创 [具身智能-633]:语音 PCM 超通俗精讲(嵌入式 / 树莓派 / RK3588 专用)

PCM = 脉冲编码调制语音从麦克风进来:模拟声波→ ADC 采样 → 变成一个个数字采样点 → 连续排列就是 PCM它是所有语音格式的原始底层裸数据,WAV/MP3/OPUS 本质都是包裹或压缩后的 PCM。PCM 是语音最原始裸数据16k 16bit 单声道小端无文件头,靠代码约定参数WAV = 头 + PCM;PCM 是去掉头的裸流语音 AI、嵌入式开发优先用 PCM。

2026-05-10 09:52:31 2

原创 [具身智能-632]:语音数据存储格式,一口气讲透(通俗 + 工程版)

人声 → 麦克风 →→→ 变成PCM 原始数据流所有语音格式,。:单声道 Mono / 立体声 Stereo(语音几乎都是。

2026-05-10 09:49:45 2

原创 [具身智能-631]:获取音频输入的代码示例

统一用,适配:USB 麦克风、I2S 麦克风、板载音频输入,。

2026-05-10 09:47:44 2

原创 [具身智能-630]:树莓派 4B/5、RK3568/RK3588 音频输入代码示例

统一用,适配:USB 麦克风、I2S 麦克风、板载音频输入,。

2026-05-10 09:47:22 4

原创 [具身智能-629]:为什么语音有这么多接口类型

树莓派 4B/5:主打I2S、USB,无硬件 PDMI2S + 硬件 PDM + TDM全配齐,天生适合语音 AI、离线唤醒、声源定位。

2026-05-10 09:46:59 5

原创 [具身智能-628]:树莓派 4B/5、RK3568/RK3588 开发板的语音传感器接口

树莓派 4B/5、RK3568/RK3588 开发板连接语音传感器(麦克风),主要通过四大类方式。下面按平台详细说明硬件接口、引脚定义与常用方案。

2026-05-10 09:46:36 5

原创 [具身智能-627]:图像数据、视频数据、点云数据 文件存储格式 大全(通俗分类 + 用途区别)

把。

2026-05-10 09:46:14 10

原创 [具身智能-626]:激光雷达读取点云数据 代码示例(Python 通用版)

(串口 / 网口 UDP)转为 XY 点云 → 可视化;

2026-05-10 09:45:53 11

原创 [具身智能-625]:从相机读取视频数据并显示的代码示例

【代码】[具身智能-625]:从相机读取视频数据并显示的代码示例。

2026-05-10 09:45:26 16

原创 [具身智能-624]:工业相机与消费电子相机的区别

消费相机:优先好看、自动美颜、压缩失真、适合人眼观看。工业相机:优先真实、无美颜无压缩、原始数据无损、适合机器算法检测。

2026-05-10 09:45:04 10

原创 [具身智能-623]:视觉传感器(芯片级) ≠ 视觉相机(应用级):完全不是一回事把核心讲透:定义含义、电路接口、信号类型、数据格式、工作方式、用途场景 全方位区分,一眼就能分清。

表格维度视觉传感器(CMOS/CCD 芯片)视觉相机(整机)形态单颗裸芯片带镜头电路的完整整机核心角色只感光、只采原始数据采集 + 图像处理 + 协议输出硬件接口MIPI/DVP/SLVS-EC 芯片高速接口USB / 网口 / HDMI应用级接口输出数据RAW 原始裸像素流YUV/RGB/JPEG/ 编码视频是否带处理无 ISP、无处理器自带 ISP / 主控 / 缓存使用方式需外接 FPGA/SoC开发驱动解析即插即用,直接出图适用人群硬件 / 底层 / 算法研发。

2026-05-10 09:44:39 12

原创 [具身智能-622]:高速图像传感器接口(视觉 / 摄像头)与数据格式

接口嵌入式 / 移动 →MIPI CSI-2超高速 / 高分辨率 →SLVS-EC工业长距 →数据格式算法 / 高画质 →RAW视频 / 显示 → YUV422 / YUV420真彩显示 →RGB888。

2026-05-10 09:44:08 12

原创 [具身智能-621]:激光雷达的原始数据(测距角度数据)与3D点云数据不是一回事

原始数据:雷达原生输出,只有距离 + 角度,无 XYZ,不能直接 3D 显示。3D 点云:由原始数据解析 + 三角函数换算得到,有 XYZ 空间坐标,可直接可视化、做算法。原始数据是原料,点云是加工结果,二者完全不是一回事。

2026-05-09 14:49:14 12

原创 [具身智能-620]:3D激光雷达3D点云数据的格式与可视化? 可视化中的颜色是什么含义?

3D 点云基础数据:每个点必有X Y Z 强度;常用格式可视化工具:RViz、Open3D、CloudCompare、厂商上位机;点云颜色只有 4 种含义按高度 Z按反射强度按线束 Ring按距离 / 语义分类。

2026-05-09 14:39:57 14

原创 [具身智能-619]:激光雷达:一维扫描 / 二维扫描 本质 + 为什么 3D 靠「多线」就能实现

只在一个平面内做角度偏转 / 旋转。只有水平方向扫描垂直方向固定角度不动轨迹一个水平圆圈2D 平面测距(只有距离、水平角,没有垂直角度普通单线 2D 激光雷达单线激光雷达:只有一维水平扫描,输出 2D 平面数据。多线激光雷达:仍是一维水平旋转,靠垂直多线分层等效实现二维 3D 扫描。不用做复杂二维机械摆动,用多线分层低成本、高可靠实现 3D 点云。线数越多:垂直分层越密,3D 点云越细腻、轮廓越清晰。

2026-05-09 14:29:49 6

原创 [具身智能-618]:激光雷达 规格与技术参数 完整含义详解

按,适配 2D 激光雷达、机械 3D 激光雷达、固态激光雷达。

2026-05-09 14:22:47 11

原创 [具身智能-617]:激光雷达传感器的工作原理、接口信号、数据格式

原理:激光发射 → 反射 → 测飞行时间 → 算距离 → 扫描成点云接口:以太网(UDP 点云)、CAN(车载指令)、同步信号数据:原始二进制帧 → 转 LAS/PCD/ROS → 得到 X/Y/Z/ 强度 / 时间。

2026-05-09 14:14:27 11

原创 [具身智能-616]:IMU 四元数是什么?(大白话 + 原理 + 作用 + 为什么不用欧拉角)

四元数是用来描述物体在 3D 空间姿态、旋转的数学工具,在 IMU 九轴里,就是用 4 个数字,唯一表示传感器当前的倾斜、旋转、朝向。格式:\(q = [w,\ x,\ y,\ z]\)4 个浮点数,没有角度,纯数学旋转描述。

2026-05-09 13:53:56 10

原创 [具身智能-615]:MU 九轴惯性测量传感器:9轴原始数据->物理量换算 ->四元数 -> 欧拉角(角度) 过程详细解析

4 个浮点数表示3D 空间姿态无万向锁、计算快是 IMU 算法的标准输出。

2026-05-09 13:10:48 8

原创 [具身智能-614]:IMU 九轴惯性测量传感器代码示例

(加速度 + 陀螺仪 + 磁力计)接口:I2C。

2026-05-09 13:04:39 8

原创 [具身智能-613]:IMU 九轴惯性测量传感器:原始数据含义 → 推导数据种类 → 对应原始数据源 → 匹配算法 → 现成算法库

原始 9 轴:加速度→静态倾角;陀螺仪→动态平滑;磁力计→锁定航向。推导数据逐级依赖:物理量→静态角→六轴姿态→九轴全姿态→四元数→导航数据。算法匹配:简单用互补滤波、标准用 Mahony、高精度用 Madgwick、工业导航用 EKF。开发直接用库:Python 用ahrs,C 用 Mahony/Madgwick 开源库,无需自研解算。

2026-05-09 12:56:53 12

原创 [具身智能-612]:IMU 惯性测量传感器 超完整详解

俯仰 Pitch:前后低头 / 抬头横滚 Roll:左右倾斜翻滚偏航 Yaw:水平原地旋转、航向角度六轴:Pitch、Roll 稳,Yaw 漂移九轴:三个角度都能长期稳定。

2026-05-09 12:42:05 11

原创 [具身智能-611]:常见传感器的接口类型与传感器数据的内容:模拟电压、温湿度、流量传感器、IMU、舵机、激光雷达等

按类别整理:模拟电压、温湿度、流量、IMU、舵机、激光雷达、距离、姿态、总线传感器,每个都讲清:接口形式、物理线序、通信协议、输出什么数据。统一前置规则:光敏、声音、火焰、土壤湿度、倾角模拟型、压力模拟传感器单路模拟输出 AO物理接口:VCC + GND + AO无数字协议,纯 0~3.3V/0~5V 模拟电压单总线 1-Wire线序:VCC + GND + DATA自定义单总线时序协议单根 GPIO 数据线,分时收发,低成本、精度一般I2C线序:VCC + GND + SDA + SCL标准 I2C 通信

2026-05-09 12:31:20 13

原创 [具身智能-610]:树莓派 4B/5 vs RK3568/RK3588 开发板传感器接口类型与协议

树莓派:简单易用、生态强、适合入门与轻量项目RK3568:工业级全能、接口全、多传感器 / 电机首选RK3588:旗舰性能、视觉 / AI / 多摄最强。

2026-05-09 12:15:50 118

原创 [具身智能-609]:PWM 波形示意图 + 各类型电机标准频率 / 参数配置(可直接照搬编程)

周期固定,高电平宽度变,平均电压变plaintext:频率固定,只调→。

2026-05-09 12:11:18 82

原创 [具身智能-608]:PWM 到底是怎么控制直流、步进、舵机、伺服电机的?

表格电机类型PWM 控制对象核心原理关键参数直流有刷转速占空比改变等效平均电压占空比 0~100%普通舵机角度位置高电平脉冲宽度对应转角周期 20ms,脉宽 0.5~2.5ms步进电机转速 + 位置PWM 脉冲频率控速、脉冲个数控行程脉冲频率、脉冲总数工业伺服转速 / 位置脉冲计数定位 或 PWM 转模拟电压调速频率、脉冲数直流电机:PWM 占空比调压 → 调速舵机:PWM 高电平时长 → 定角度步进 / 伺服:PWM 当脉冲波 → 频率调速、个数定位。

2026-05-09 11:56:08 121

原创 [具身智能-607]:直流电机 / 步进电机 / 伺服电机 与主控开发板(树莓派 4B/5、RK3568/RK3588)控制接口、信号定义、电气协议全详解

4 路普通 GPIO 时序PUL 脉冲 + DIR 方向 + ENA 使能(最通用)智能驱动:再加 UART/RS485 参数配置无 CAN 也可控制,多轴才上 CAN/485 总线。

2026-05-09 11:48:15 227

原创 [具身智能-607]:树莓派 4B/5 或 RK3568/RK3588 开发板的电机电气接口与通信协议

多轴伺服:通过 CAN FD、EtherCAT、RS485 连接伺服驱动器。舵机:直接 3.3V PWM 信号(需共地,大电流舵机需外部供电)4B:2 路硬件 PWM(GPIO12/13、18/19)用途:舵机(SG90 等)、直流电机调速、步进电机脉冲。5:4 路硬件 PWM(RP1 控制器增强)GPIO 发脉冲 / 方向。伺服驱动器 → 电机编码器。(RK3588 更适合)

2026-05-09 11:30:59 257

原创 [具身智能-606]:树莓派 4B/5 vs RK3568/RK3588 开发板:全方位对比(具身智能 / 机器人 / 学生入门)

树莓派4B支持H.265 4K@30fps软解,树莓派5升级为双4K@60fps解码能力,但主要依赖CPU和GPU的软件解码。在编码方面,树莓派4B支持H.264 1080p@30fps硬编,树莓派5提升至H.265 4K@60fps硬编,但实际编码性能仍受限于软件方案。,RK3588的LPDDR5X内存带宽达到51.2GB/s,是树莓派5的1.5倍,这使其在处理高分辨率视频和复杂AI任务时具有显著优势。值得注意的是,RK3588的工作温度范围更广,支持-20℃至70℃环境运行,更适合工业场景。

2026-05-09 11:00:33 243

原创 [具身智能-605]:零基础・基于淘宝现成套件 搭建具身智能低端入门学习环境

完全,直接买淘宝,开箱组装、按步骤装系统、装软件、调通硬件、跑通完整。适合:学生、自学、零基础、想入门具身智能 / 机器人 / ROS。

2026-05-09 10:39:44 297

原创 [具身智能-605]:全套具身智能环境搭建三大路径(分:低端入门硬件版、纯仿真开发版、高端商用全套版)

下面每条路径都给位、硬件清单、软件清单、从 0 到 1 详细搭建步骤、可落地练习任务。

2026-05-09 10:23:18 287

原创 [AI应用与提效-178] - AI辅助写技术书籍(出版)的通用过程与方法

技术书籍(出版级)的创作核心是“专业严谨、逻辑闭环、实操落地、符合出版规范”,AI在此过程中并非替代作者,而是精准赋能的“专业协同工具”——核心价值在于解放作者的重复性劳动(资料检索、公式推导、案例整理、格式规范等),让作者聚焦核心创作(专业观点输出、技术逻辑打磨、实战经验提炼、出版合规把控)。

2026-05-09 00:30:15 309

原创 [具身智能-604]:具身智能9步学习法:①机械本体 ②电机运动 ③感官传感 ④操作系统与平台软件 ⑤ 模拟仿真 ⑥ 算法: 感知/规划/控制/模型 ⑦训练/学习/部署 ⑧端云协同 ⑨仿真到现实

为了拨开迷雾,我们梳理出了这套“具身智能九步学习法”,它将带你从物理硬件的底层逻辑出发,穿过算法的复杂迷宫,最终抵达虚实融合的彼岸。这九个步骤,构成了一个从硬件到软件、从理论到实践、从虚拟到现实的完整闭环,掌握了它们,你就掌握了开启具身智能大门的钥匙。这不仅仅是写代码,而是构建一个分布式的神经系统,让零散的硬件与算法整合为一个有机的整体,确保信息在毫秒级的时间内准确流转。具身智能对算力的需求是无止境的,复杂的模型训练和高级任务规划需要强大的云端算力,而实时的运动控制则要求边缘端的毫秒级响应。

2026-05-07 21:54:31 312

原创 [具身智能-603]:Node.js详解以及对应的包管理器(npm)

Node.js 是一个基于 Chrome V8 引擎的JavaScript 运行时环境,它让 JavaScript 能够。而 npm (Node Package Manager) 是随 Node.js 一起安装的官方包管理器,是全球最大的 JavaScript 软件生态系统和注册表。下面将从核心原理、模块系统和包管理器三个方面为你详细解读。

2026-05-07 14:37:59 298

原创 [具身智能-602]:Three.js如何利用3D模型文件与URDF文件,完成机器人Web仿真?

利用 Three.js 进行机器人 Web 仿真,主要有两种主流的技术路线,它们分别对应着不同的模型文件格式和应用场景。简单来说,选择哪种方式取决于你的需求是还是。这是机器人领域的标准方法。URDF (Universal Robot Description Format) 文件本身就定义了。Three.js 可以通过专用这是和中的方法。你将机器人视为一个带有。Three.js 加载模型后,你需要通过下面将详细解析这两种路线的实现过程。

2026-05-07 14:32:03 275

原创 [具身智能-601]:Three.js概述与机械臂仿真与通信过程示例

你可以将 Three.js 理解为一个在网页里搭建“虚拟舞台”的工具箱。整个 3D 世界的容器,所有物体都放在这里面。观察场景的“眼睛”,决定了用户能看到什么角度和范围。负责将场景和相机捕捉到的画面“画”到网页的<canvas>元素上。场景中的具体对象,由几何体(形状)和材质(颜色、纹理)构成。照亮场景,让物体产生明暗和立体感。物理设备将状态数据发布到。Web前端订阅该主题,通过 WebSocket 实时接收数据。JavaScript 代码解析数据。

2026-05-07 14:20:04 321

stm8l152m8.pdf

STM8L151x6/8 STM8L152x6/8 8-bit ultra-low-power MCU, up to 64-KB Flash, 2-KB data EEPROM, RTC, LCD, timers, USARTs, I2C, SPIs, ADC, DAC, comparators

2020-07-27

O-RAN IOT Cooperative Transport Interface Transport Control Plane Specification

O-RAN Fronthaul Working Group 4 Cooperative Transport Interface Transport Control Plane Specification

2020-09-06

IEEE Std 802.1AX-2008 Link Aggregation

IEEE Standard for Local and metropolitan area networks—Link Aggregation

2020-09-06

IEEE Std 802.3-2008 section 1-20.pdf

Carrier Sense Multiple Access with Collision Detection (CSMA/CD) access method and Physical Layer specifications 1-20章

2020-09-06

IEEE Std 802.3-2008 section 34-43.pdf

Carrier Sense Multiple Access with Collision Detection (CSMA/CD) access method and Physical Layer specifications Chapter 34-43

2020-09-06

IEEE Std 802.3-2008 section 56-74.pdf

Carrier Sense Multiple Access with Collision Detection (CSMA/CD) access method and Physical Layer specifications Chapter 56-74

2020-09-06

ADI RFIC ADRV9009 datasheet

ADI RFIC ADRV9009 datasheet

2021-01-03

O-RAN.WG4.MP.0-v07.00.00.pdf

RAN.WG4.MP.0-v07.00:O-RAN Alliance Working Group 4 Management Plane Specification

2022-01-14

O-RAN.WG4.MP.0-v06.00.pdf

O-RAN.WG4.MP.0-v06.00: O-RAN Alliance Working Group 4 Management Plane Specification

2022-01-14

O-RAN.WG1.Architecture+Description+v1.0.pdf

Provides a high-level view of the O-RAN architecture 这是ORAN的系统架构的英文规范

2020-06-10

ORAN系列-1-什么是开放无线接入网ORAN.docx

这篇文章将回答如下几个问题: 什么是无线接入网RAN? 什么是开放无线接入网ORAN? ORAN与5G的关系? ORAN提出的动机?ORAN的参与方?以及ORAN的技术目标?ORAN标准的组织架构?

2020-06-10

第三届无线通信 AI 大赛与数据集介绍

第三届无线通信 AI 大赛与数据集介绍

2022-08-07

6G无线热点技术研究白皮书

6G无线热点技术研究白皮书

2020-12-31

SCF225_5G_nFAPI_specification_1.0.pdf

SCF225_5G_nFAPI_specification

2021-06-05

convertLabelmeToYolo.py

工具:把Labelme数据集转换成YOLO 数据集

2022-01-06

convertVideoToImages.py

工具:把视频文件转换成images

2022-01-06

convertYoloLabelToBox.py

工具:把yolo数据集转换成带预测框的图片

2022-01-06

CycleGAN的总体架构.pptx

CycleGAN-pix2pix的软件总体架构,图形化展示,与开源代码完全一致

2021-12-23

THUCNews.zip

LSTM/CNN网络实现新闻文本分类Jupter源代码,下载后可以在Jupter下直接运行。 包括词向量表,单词词典,jupter源代码

2021-12-10

IEEE Std 802.3-2008 section 21-33.pdf

Carrier Sense Multiple Access with Collision Detection (CSMA/CD) access method and Physical Layer specifications Chapter 21-33

2020-09-06

O-RAN.WG1.OAM-Architecture-v03.00.pdf

ORAN操作与维护架构(英文版):O-RAN Operations and Maintenance Architecture

2020-06-10

O-RAN Fronthaul Working Group Control, User and Synchronization Plane Specificat

O-RAN Fronthaul Working Group Control, User and Synchronization Plane Specification

2020-09-06

O-RAN Alliance Working Group 4 Management Plane Specification

O-RAN Alliance Working Group 4 Management Plane Specification

2020-09-06

O-RAN.WG1.OAM-O1-Interface.0-v03.00.pdf

ORAN操作维护的接口规范(英文版):O-RAN Operations and Maintenance Interface Specification

2020-06-10

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除