- 博客(51)
- 资源 (12)
- 收藏
- 关注
原创 做了一块可以调用百度云语音识别api和tts api的esp32 s3开发板,支持跑ai小智机器人的源码,基于idf5.5.1库编译,分享下
做了一块可以调用百度云语音识别api和语音合成tts接口的esp32 s3开发板,支持跑ai小智机器人的源码,基于idf5.5.1库编译,分享
2025-12-25 14:45:45
1342
1
原创 stm32单片机裸机调用百度语音识别接口和合成接口的部分代码实现,有意向的可以联系我 qq790861133
stm32单片机裸机调用百度语音识别接口和合成接口的部分代码实现,有意向的可以联系我 qq790861133 ---作者:阮丁远先介绍个要用到的函数:lwip 下 WebClient或者说http cilent的实现:int8_t WebClient(const char *url, const char *post, uint8_t **pageBuf,uint8_t is...
2018-11-08 18:49:22
8581
4
原创 可微分结构搜索, 可微分算子选择 —— 让程序“结构”也可学习 , 具体怎么实现结构的轮询穷举
这是物理实现的基础。你需要构建一个包含所有候选算子的“超级网络”。对于网络中的每一个节点连接(边),不再放置单一的操作,而是放置一个包含所有候选操作的混合模块。# 将所有候选算子实例化并放入列表# 核心逻辑:加权求和# weights 是一个向量,长度等于候选算子数量为何像穷举?在每一次前向传播中,所有算子都参与了计算。这相当于程序不是在选 A 或 B,而是在计算“A 和 B 的某种混合”。通过权重的变化,程序在连续空间中“扫描”了所有可能的组合。
2026-03-31 23:23:26
9
原创 可微分的代码结构 具体是怎么样的
连续参数化:所有离散选择(算子、分支、循环次数)都被替换为可训练权重(标量、向量或矩阵)。光滑操作:使用 Softmax、Sigmoid 等函数进行加权混合,使得输出对权重的导数处处存在。统一的优化:整个结构可以用标准的梯度下降(如 Adam)进行端到端训练。后处理离散化:训练完成后,通过剪枝、取 argmax 等方式,将软结构还原为硬代码,从而获得可解释的程序。这种结构既保留了编程的灵活性(可以组合不同算子),又具备了深度学习的可训练性,是连接符号主义程序合成与连接主义深度学习的桥梁。
2026-03-31 20:28:25
19
原创 C#插件化架构(Plugin Architecture)或 可插拔架构,根据产品类型编码的不同自动路由到目标函数,而无需为每个产品都编码相应的代码!!
string is_ok = call_a_function_in_Codes_Dirs(prodtype.ToString(), "ctrl_mod", new object[] {Name1, switch_ctrl_enable, tiaoguang_ctrl_enable, item11netgate, cur_task, mod_addr, wait_time_ms_1, is_changjing_cmd_优先于面板主动发包 }).ToString();// 获取当前程序的程序集。
2026-03-31 15:35:42
40
原创 训练好的大模型的每个触角上的qkv矩阵都是一样的?,那怎么自动对不同的句子输入,经过这个固定的qkv权重矩阵乘后,得到不同的后续的逻辑管道,
QKV 矩阵是固定的,但它们不是“模板匹配器”,而是线性变换器。输入的多样性通过固定变换后,仍然保持多样性,并且这种多样性会在注意力机制中被放大,使得模型能针对不同句子产生完全不同的内部表示和输出。正是这种“固定参数 + 变化输入”的组合,让大模型拥有了处理无限多样语言现象的能力。
2026-03-10 18:53:39
218
原创 每层触角的组合的结果如果都要再次和所有元算子结合,这种全息的组合,具体怎么自动被系统设计和训练
文章摘要: 深度学习中的"全息组合"类似于混合专家模型,通过软选择机制实现算子自动组合。系统采用加权求和方式让输入同时经过所有算子,通过训练学习各算子的权重分布。训练过程分为层级组合:初级层提取基础语义,逻辑层建立实体-数值绑定,推理层完成最终计算。为获得确定性结构,系统引入稀疏性约束和Gumbel-Softmax技巧,促使权重收敛至0或1。这种架构本质是可微分的动态解释器,通过梯度下降从全息组合中筛选出最优计算路径。
2026-03-06 00:00:11
173
原创 我打算重构大模型: 假设 由100个触角组成的最大100个上下文的句子输入层,每个触角都可以通过逻辑管道和其他触角组合或和后面的子逻辑管道再组合,逻辑管道可以形成ai内存机制.....来自智谱清言
摘要:本文提出了一种新型神经网络架构,通过100个并行触角(输入单元)和可组合逻辑管道来实现结构化推理。该架构采用神经符号主义方法,将神经网络的感知能力与符号逻辑的推理能力相结合。核心设计包括:1)触角负责接收和编码输入信息;2)逻辑管道实现实体聚合、属性绑定和算术运算;3)内存机制存储中间变量。训练过程采用门控软路由机制,通过梯度下降从随机初始连接中逐步强化有效管道组合。该方法特别适合数学应用题求解等需要精确推理的任务,相比传统Transformer架构具有更好的逻辑性和可解释性。实现上建议采用图神经网络
2026-03-05 23:51:53
290
原创 在公司工作,代码项目越来越多,复杂度越来越大,导致 很难维护,继而引发情绪比较低,继而引发大量bug,怎么办
停止自责,接受项目很烂的现实。每次只改一点点,多写防御性代码,不碰无关逻辑。记录日志,不盲目修补,先分诊。哪怕每天只改进一行代码,也是在向上走。记住:代码是写给人看的,偶尔也是给人折磨的。保护好自己的情绪,才是写出好代码的前提。
2026-02-27 10:08:15
351
原创 这个head分工机制,怎么结合我的ai内存机制(也类似qkv管道,每个管道有ai内存地址和ai内存值),和怎么结合 句子解析规则,真正实现白盒和黑盒的结合,来降低大模型的算力依赖
将你的想法落地,本质上是在构建一个“可微分的操作系统”解析型 Head调度器(Scheduler):根据规则分配任务。寻址型 Head内存管理器(MMU):管理 AI 内存的地址管道。取值型 HeadCPU/ALU:执行具体的数据操作。这种白盒规则(逻辑骨架) + 黑盒 QKV(神经直觉)的结合,正是下一代 AI 架构打破算力诅咒的最优解。
2026-02-22 19:28:20
483
原创 【自动分工:让不同的 Head 分别负责“数值计算”、“语义过滤”等不同工种】,这种自动分工机制时,不同的head之间怎么自动互斥,就是自动知道某条qkv逻辑链路已经被其他head占用了,而不再去..
梯度只流向错误,已修正的错误没有梯度。当一个 Head 把某条逻辑链路走通了,该处的梯度就归零了。其他 Head 想要获得梯度的“奖赏”,只能去寻找那些还没被走通的路。这就是为什么它们“自动知道”这条路被占用了——因为被占用的路已经铺平了,没有阻力(梯度)推着它们往那儿走了。
2026-02-21 10:12:26
422
原创 除了 多head间的自动分工现象,qkv里还有其他啥强大的机制,我没发现的??
解耦机制:赋予了模型“定义变量”和“调用变量”的能力(QK找地址,V取内容)。自动分工:让不同的 Head 分别负责“数值计算”“语义过滤”等不同工种。层级组块:让浅层 Head 先把单词拼成概念,深层 Head 再处理概念间的逻辑。残差连接:保证了在逻辑构建过程中,原始信息不会丢失,允许模型进行稳妥的“试错修正”。这就是为什么简单的 QKV 公式,能涌现出如此惊人智能的原因。它不仅仅是一个注意力机制,它是一个可微分的、层级化的逻辑编程系统。
2026-02-21 00:35:48
316
原创 是否无需预设模板式的梯度下降法,因为 qkv存在 多个 Head 分家的自动分工 现象,因为其qkv权重的初始化时的微小误差,导致后续的qkv逻辑管道的巨大差别,等价式的实现了多个 qkv逻辑管道的组
你的观察非常敏锐,确实触及了多头注意力机制的核心优势之一。下面我们来深入探讨这个问题。
2026-02-21 00:31:31
250
原创 自动分工 现象时,一共有几种可能得权重组合变化,如何确保这些组合的扫描时的不发生组合爆炸
LLM 不需要像人类做选择题那样去“扫描”组合。它利用。
2026-02-21 00:01:44
600
原创 llm大模型qkv在训练时如何自动调整qkv的管道链路权重,来自适应所需要的逻辑通路结构
这是一个非常深入的问题。在LLM(大语言模型)中,QKV并没有显式的“开关”来决定走哪条路,所谓的“逻辑通路自适应”,本质上是的过程。我们可以用和这两个机制来解释这个过程,这比单纯的梯度下降更形象。
2026-02-20 23:51:09
518
原创 qkv训练时单纯用梯度下降法是否容易捕捉不到逻辑组合,是否需要模板式的梯度下降法,比如 捕捉数量和数量和 这个捕捉模板
单纯依赖梯度下降法去发现逻辑组合,效率极低且泛化性差。在处理逻辑任务时,确实需要“模板式的梯度下降法”。归纳偏置:在网络结构设计时就内置逻辑模式。辅助损失函数:强制引导注意力关注特定的逻辑组合单元。课程学习:先教模型识别“什么是数量”,再教“如何组合数量”,模拟模板的构建过程。未来的发展方向正是将“逻辑规则”这种离散的硬约束,与“神经网络”这种软拟合更好地结合,而不是单纯依赖梯度下降的随机游走。
2026-02-18 00:25:16
328
原创 W_Q[CLS]调整: 使其与数值token的K更匹配 这个梯度下降怎么自己能知道要调整W_Q使其与数值token的K更匹配
这是一个极好的问题,触及了深度学习的核心奥秘!让我详细解释梯度下降是如何“知道”要这样调整的。
2026-02-05 08:31:17
553
原创 演示下 一个qkv网络逐步趋向出局部加法结构的过程的每个详细的子步骤 -----来自deepseek的回答
我们考虑一个简化的Transformer模型,可能只有一个注意力头,甚至可能只有一个注意力层。我们的目标是展示模型如何从随机权重开始,通过训练逐步学会从输入序列中提取数字并执行加法。注意:实际上,训练一个Transformer模型需要大量数据和迭代,我们这里只是概念上描述这个过程,并给出一个简化的数值示例。步骤1:定义输入表示假设我们的输入序列是:["2", "苹果", "3", "梨"]。为了简化,我们忽略CLS和SEP等特殊token。我们使用嵌入向量来表示每个token。假设嵌入维度为4。
2026-02-05 00:48:08
533
原创 通讯怪现象
模块可以连接服务器上的串口助手虚拟的96端口,服务器上的串口助手也能连接到服务器上的服务端的端口96,最后发现是不知道谁又打开了服务器的防火墙!但是模块死活连不上服务端的端口96,
2026-02-02 14:50:37
47
原创 无论单片机端还是pc端,crc16都不要用查表法,而用代码计算法,因为一旦不小心改了表的任意数,就导致偶发性的crc16异常!!!
无论单片机端还是pc端,crc16都不要用查表法,而用代码计算法,因为一旦不小心改了表的任意数,就导致偶发性的crc16异常!
2026-01-24 16:06:04
254
原创 每20秒判断一次485芯片的 RE/DE 脚信号是否需要重置为0,来防止一直为1而占用了485总线不释放,导致其他模块一直无法通讯
丢了一次后,TMR_per_100us里强制设置UART0_Enable(B_TRUE, B_FALSE)还能来得及,比如6ms内回码时可以。if(gpio_output_data_bit_read(GPIOA,RDE2_Pin)==1){ //读485芯片的 RE/DE 脚信号,#if Uart1_is_use_TRC_flag_mode==3 //用于实时性要求不高的地方,比如不用74hc595输出pwm调光波形的时候。
2026-01-21 10:54:45
572
原创 对于 volatile uint16_t *p_flash,p_flash + 1 会使地址增加2字节,而不是1字节。----来自deepseek的回答
是的,对于会使地址增加2字节,而不是1字节。这是因为:C语言的指针运算会自动考虑类型大小uint16_t类型占用2字节指针加1实际上是指向下一个同类型元素,而不是下一个字节如果您需要按字节递增访问,应该使用uint8_t *类型的指针。
2026-01-20 13:19:36
492
原创 当单片机c代码里有 printf 函数时,如果未加对应的支持,会导致 单片机死机,
* 保护前4个扇区(4KB each) *//* 8. 设置Flash保护(保护前32KB) *//* 5. 写入数据到Flash *//* 6. 从Flash读取数据 *//* 10. 反初始化Flash *//* 2. 检查Flash状态 */* @brief Flash操作示例。/* 1. 初始化Flash *//* 9. 计算CRC校验 *//* 3. 擦除第0扇区 *//* 4. 准备测试数据 *//* 7. 验证数据 */
2026-01-20 11:20:57
450
原创 单片机的记忆芯片里的各个参数的地址如果有交叉,比如 3-28里是版本号字符串,27里是是否初始化过的标志位,那么,写版本号后,就会影响27地址里的是否初始化过的标志位,导致参数全部丢失!!!
单片机的记忆芯片里的各个参数的地址如果有交叉,比如 3-28里是版本号字符串,27里是是否初始化过的标志位,那么,写版本号后,就会影响27地址里的是否初始化过的标志位,导致参数全部丢失!
2026-01-19 15:06:49
120
原创 在主版本上升级改了一个功能A,以为主版本的分支版本也改过这个功能A
在主版本上升级改了一个功能A,以为主版本的分支版本也改过这个功能A,最后烧录分支版本的固件到单片机,出现异常,经过查找和比对,才发现主版本的分支版本上没加这个功能A,当时只加在主版本上了!
2026-01-19 14:59:57
117
原创 单片机屏幕多级菜单系统之当前屏幕号+屏幕菜单当前深度 机制
flag_save_canshuos_init && re_try_count<=10){//防止误触发 初始化 的操作!if(LCD_CurMenu.Line==Item_Line_Index){//如果是当前的项。
2026-01-08 10:58:34
839
原创 if (is_scan_packet == 1 && G_pasue_scan == 1)的break 要放到prod_comm_obj.AutoResetEvent1.WaitOne 后面
if (is_scan_packet == 1 && G_pasue_scan == 1)的break 要放到prod_comm_obj.AutoResetEvent1.WaitOne 后面,防止需要G_pasue_scan=1的任务意外返回了is_scan_packet=1包的回复包!
2025-12-29 13:35:12
52
原创 websocket下发mp3帧数据时一个包被分包为几个子包而导致mp3解码失败而播放卡顿有杂音或断播的解决方法
MP3数据分包而导致mp3解码失败
2025-12-29 09:31:36
105
原创 为了防止单片机后台程序一直在写i2c 记忆芯片,加了每次写时闪烁led的机制,防止寿命耗尽
/写地址高8位 | | | | -----------1、2、3 000=A0 A1 A2 接低电平 111=A0 A1 A2 接高电平。//写地址高8位 | | | | -----------1、2、3 000=A0 A1 A2 接低电平 111=A0 A1 A2 接高电平。// | | | | | | | |----0、0=写 1=读。// | | | | | | | |----0、0=写 1=读。
2025-12-27 10:33:05
590
原创 foreach (UserControl ele1 in panel_guzhang_shower.Controls)后不能ele1 as TextBox;
= null)break;。
2025-12-22 16:33:34
234
原创 给出一些一年级的小学数学应用题的题目和答案对 作为训练语料输入,那怎么自动训练出这些 模拟 变量机制,来自动实现应用题所需要的 数量累加机制
python复制下载# 嵌入层self.position_embedding = nn.Embedding(100, d_model) # 最大长度100# 变量状态记忆槽(模拟变量存储)self.variable_slots = nn.Parameter(torch.zeros(5, d_model)) # 5个变量槽# Transformer编码器# 数值提取头(识别数字)nn.ReLU(),# 操作分类头(识别加减乘除)nn.ReLU(),# 答案生成头。
2025-12-17 12:34:48
793
原创 qkv机制怎么自动模拟 变量机制,来实现 数量累加等用途,来自deepseek的回答
QKV机制通过模式匹配和权重分配来模拟变量访问,通过前馈网络实现数值计算,通过层间传递保持状态。虽然不是传统意义上的变量系统,但足够强大的Transformer可以学习到类似的抽象操作,实现累加、存储、读取等功能。
2025-12-17 10:39:33
332
原创 雅特力单片机用串口USART_INT_TDE中断比用USART_INT_TRAC的 发送效率要高
丢了一次后,TMR4_GLOBAL_IRQHandler里强制设置UART0_Enable(B_TRUE, B_FALSE)还能来得及,比如6ms内回码时可以。//这个用于保证不发生:如果丢了一次UART0_Enable(B_TRUE, B_FALSE),则再也不能进入接收模式,导致通讯卡死。void TMR4_for_when_UART0_Enable_falt(void)//20us 一次。
2025-12-15 12:39:14
719
原创 测试各参数量在通讯时是否解析正确的方法
测试各参数量在通讯时是否解析正确的方法是:在从机被读端可以先强制设置所有路的某个待测试参量为。12345,或者为 回路号*1000, 然后上位机与之通讯并读出值,看值是否正确!
2025-12-11 10:29:05
124
原创 LLM预训练动态权重调整机制:用单文件的c#写一个这个这种代码训练的机制,来自deepseek的回答
损失函数扩展:代码训练不只是交叉熵,还包括结构损失、语法损失注意力模式:代码训练使注意力权重学习特殊模式(作用域、语法配对)多任务学习:通过多种相关任务(掩码预测、类型推断)联合训练层次化训练:先学轮廓,再学细节评估驱动:编译通过率、语法正确性等指标指导训练本质:在代码训练中,WqWkWv等权重通过反向传播更新,学习捕捉代码特有的结构模式、语法约束和逻辑关系,而不仅仅是文本的统计规律。模型通过预测整个代码段(而不仅是下一个词)来学习如何生成正确、可运行的代码。用单文件的c#写一个这个这种代码训练的机制。
2025-12-07 19:37:19
718
易首51单片机开发板(实验板学习板 )介绍和使用说明.doc
2012-09-26
万刀自动切图软件 自动切效果图生成div/table/html静态页面工具
2013-12-30
GS013-单头DIY的smt视觉贴片机的机架的机械图纸(同步带+57hs22+导轨)
2016-01-29
聊天机器人+自动解小学数学应用题人工智能源码
2014-07-27
新乙王万能网站内容管理cms系统源码 v4.22
2019-12-16
红水晶.net2.0技术可万能扩充栏目式开源企业网站V3.11
2008-01-25
ruan_阮工的单片机编程经验集:如何做稳定单片机程序与上位机程序防卡顿,js等经验,联系qq790861133,20191207.txt
2019-12-08
cms远企万能企业网站系统V1.4
2007-05-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅