自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

liangwqi的博客

技无止境,空藏万有 虚怀若谷,莫争高低

  • 博客(210)
  • 资源 (2)
  • 收藏
  • 关注

原创 直流电机(二)

直流电机作为一个电磁装置,对于用户来说要哪些参数是他们关注的呢。• 额定功率PN:电机在铭牌规定的额定状态下运行时电机的输出功率(W/kW)• 额定电压UN:电机出线端额定电压(V )• 额定电流IN:电机出线额定电流(A)• 额定转速nN:(r/min,r.p.m)• 额定励磁电压UfN:(V)• 额定励磁电流IfN: (A)• 额定效率ŋN: (%)PN​UN​⋅IN​PN​UN​⋅IN​⋅ηN​。

2024-08-12 22:22:26 478

原创 直流电机(一)

• 结构复杂,使用和维护较方便,使用直流电源。• 调速性能好。• 起动、制动转矩大,易于快速起动、停车。• 易于控制。• 应用:轧钢机、电气机车、无轨电车、中大型龙门刨床等调速范围大的大型设备;用蓄电池做电源的地方,如汽车、拖拉机等;家用。

2024-08-08 17:19:05 440

原创 电机学前置知识

对于等截面、磁密分布均匀、材料一致的简单磁路,假设磁通为Φ,磁动势为F=Ni,磁路截面积为A,磁路平均长度为l。3.应用基本定律,建立电机中的电动势、磁动势、功率和转矩的平衡关系,导出等值电路,建立电机的数学模型(基本方程)磁饱和:当铁磁材料中的_B_达到一定的程度后,随着_H_的增加,_B_的增加逐渐变慢,磁导率µ Fe减小。磁滞回线:由于磁滞效应,铁磁材料的磁化过程不可逆,在等Hmax反复磁化过程中,铁磁材料的B-H形成。当导体置于交变的磁场中,与磁场正交的曲线中产生的感应电流,即涡流。

2024-08-07 20:59:25 583

原创 电机物理数学建模

要实现机电能量转换,机电装置中首先要有耦合场和与之关联的电磁系统和机械系统。 耦合场可以是电场,也可以是磁场。由于在正常的磁通密度和电场强度下,单位体积内空气 中的磁场储能要比电场储能大得多,所以实用的电机都以磁场作为耦合场 。其次,耦合场必 须具备特定的性质,即耦合场的储能发生变化时 ,能在所连接的电系统和机械系统中产生相 应的反应,即出现机电耦合项,例如在绕组中产生感应电动势,在转子上产生电磁转矩 。所 以,确定磁场储能、确定感应电动势和电磁转矩,是研究机电能量转换过程的先导。

2024-08-06 16:30:40 1034

原创 从技术角度解读【与辉同行】文案(一)

将一段岁月熔成佳酿,三晋儿女荡气回肠。捧一把黄土架起火柴,华夏大地照亮火光。五千年黄土风云,历代千秋根固魂盈。三万顷汾河烟雨,唐风宋韵人杰地灵。当先辈手持石器抛挖黄土切割猎物,石块碰撞声百万年后仍在风陵渡口回响。当星星微火于欢呼中燃起,光焰闪烁带来温暖,百万年来华夏夜空再未被黑暗蒙蔽。虽然不知道祖先曾对这片大地有何种美好的期许,但前仆后继的耕耘者用愈发灿烂的文明回应着先辈的低语。日出万物生,是燮父赋予了晋背后的意义。领命天子,独霸中原,声震春秋百余载。定国时期,军治万乘,威延齐楚千余里。

2024-08-02 16:32:47 842

原创 Agent让大模型从“解释问题”到“解决问题”

大模型要实现从“解释”问题到“解决”问题的跨越,就离不开Agent。目前Agent有两条实现路径:1.SOP+BOM,提前对解决问题流程抽取,根据问题调用相应处理问题流程2.设定奖励规则,用RL算法让Agent自主探索文章主要是介绍了SOP+BOM的agent实现路径。这条实现路径更可控更适合当前企业实际需要。结合当前市面的几款产品,提出了:基本能力、支持工具集、操作编辑性、持续开发能力,四个维度的差评测评标准;对几款产品做了测评评价。目前看产品都具备基本工作流编排能力、每个流程测试、追溯能力,都支

2024-07-23 16:21:52 1013

原创 如何训练出模型的推理规划能力

近期opanai对AGI做了等级划分;等级划分意味着AGI有了一个考核定义,有了升级打怪的评价指标。并给出了目前openai正处在第一级,即将达到第二级的论断。预计在一年或者一年半内实现第二级,可以完成基本问题解决任务的系统。文章下面部分会简单的介绍一下,如何从第一级进阶到第二级。可能的技术路线,对于第一级AGI实现路径已经有非常多的讨论,并且很多企业、团队也已经实现达到了openAI第一级的水准。也就是数第一级别的pretrain、sft、rlhf三阶段已经是一个事实的实现路径标准了。

2024-07-22 15:33:26 1042

原创 Qwen2-Audio产品说明

这些结果表明,Qwen2-Audio是一种具有潜力的音频-语言模型,可以应用于各种实际场景中的音频理解和交互任务。这些数据集被用来训练Qwen2-Audio模型,以提高其在各种任务上的性能,包括语音识别、语音翻译、情感识别和声音分类等。通过以上三个阶段的训练,Qwen2-Audio能够逐步提高其在各种音频和语言任务上的性能,并最终实现高效的音频理解和交互功能。在预训练阶段,Qwen2-Audio的目标是学习通用的音频和语言表示,以提高其在各种任务上的性能。

2024-07-18 12:30:17 1141

原创 LLM面对复杂业务如何划分和组织任务

### 引言- 文章讨论了在LLM(大型语言模型)时代,如何将抽象的知识概念具体化到实际业务中,以使模型能够更好地服务于业务。- 文章提出了两个关键过程:概念对齐和知识激活。### 概念对齐- 概念对齐主要通过SFT(监督微调)和RLHF(基于人类反馈的强化学习)来实现业务私域指令和通用知识概念的对齐。- RLHF更多地用于解决非对错问题,如选择观点站队。- 一些私域会进行知识增量二次预训练来增强模型的私域能力。### 知识激活- 知识激活是指如何根据实际私域差异化任务

2024-07-09 15:36:51 1053

原创 Ai Native应用开发(一)--数字人

2024年世界人工智能大会(WAIC)参会感受● 参会人员多样化:2024年的WAIC参会人员包括销售、技术、算法、研究人员、产业实践方等各类角色,相比去年更加多样化。● 应用和实践报告增多:今年的会议中,应用和实践报告的数量明显增加,各大公司争相发布自己的AI产品。● 会议主题聚焦:主要围绕大模型和人形机器人两大主题展开,各公司在努力结合自身产业特点创造差异化的产品和思路。● AI在教育上的应用:AI在教育上的应用表现较为成熟和实用,这可能得益于国家在教育数字化方面的推动。AI Native应用

2024-07-08 18:07:40 718

原创 全同态加密在大模型应用中应用

假如我们拥有两条消息 𝑚0,𝑚1 的加密,分别为 𝑐𝑡0,𝑐𝑡1 ,展开来就是:我们可以注意到,如果我们把两条密文的两个部分各自相乘的话,我们就可以得到一个新的密文 𝑐𝑡^ :𝑐𝑡我们得到的结果恰恰就是原文 𝑚0+𝑚1 加在一起之后所对应的加密密文!这样的话,如果我们得到了两条加密算法的密文,我们就可以通过这样的方法得到密文的任意线性组合了。

2024-07-01 18:19:57 822

原创 Motion clone驱动视频生成的一些思考

生成模型是一种任务设计型的学习,这种学习方式区别于判别式学习地方在于:通过任务设计的方式实现显示的loss设计的效果,这样可以把很多用无法显示loss设计的任务变得可能,并且可以把很多因为认知偏差导致无法解耦合的问题可以解。也就是任务设计巧妙的绕开了需要非常明确的把细节拆开设计loss才能解决问题的困局。很多问题看起来是耦合的,你站在这个视角看可以这么区分,在另一个视角看可以那么分;但无论如何都千丝万缕无法完全切分开,如果这样那么我们就永远是近真实,很多问题如果站的视角不对就会被分的非常细,如此细的任务很多

2024-06-14 11:36:53 547

原创 适合营销的叙事可视化

数据可视化通过图像传达信息——这是你所收集数据的视觉表示。通过提供原始数字和图表,它可以帮助通过图表、图形、电子表格、地图和数字来支持更好的组织决策。在制作你的数据故事时,有两种类型的数据可视化需要探索:解释性和探索性。解释性可视化,也称为信息性,向观众传达特定方面或整个故事。另一方面,当你不确定你需要用你收集的数据回答什么问题时,会使用探索性可视化。通过使用数据可视化来讲述你的故事,你为你的观众提供了一个更完整的故事,从而允许他们建立相关性、识别趋势,并得出自己的结论或形成自己的观点。

2024-06-12 12:06:20 1147

原创 用大模型实现PPT可视化几种思路

他们大致的思路是:用户内容如何呈现应是需要对用户内容理解选择合适的呈现方式,生成内容可视呈现计划大纲,然后对每部分的内容细化充分的分析挖掘ppt工具的属性来做细粒度优化呈现。充分的理解PPT这种工具的可视化呈现优势,对每部分的素材生成合适的呈现效果,比如:大小、颜色、动效,前后颜色搭配,颜色比对,图表…对于如何根据用户输入的信息做信息的整理组织,然后把整理组织信息作排版,生成合适的PPt呈现不是重点介绍对象。这种实现方式已经对ppt信息可视化做了一层建模,会对用户的输入做理解,重新组合生成合适的呈现方式。

2024-06-07 12:31:46 2472

原创 MotionEditor_ 通过内容感知扩散编辑视频运动

现有的基于扩散的视频编辑模型在随时间编辑源视频的属性方面取得了显著进展,但在修改运动信息的同时保持原始主角的外观和背景方面存在困难。为了解决这个问题,我们提出了MotionEditor,这是一种用于视频运动编辑的扩散模型。MotionEditor将一种新颖的内容感知运动适配器集成到ControlNet中,以捕捉时间上的运动对应关系。虽然ControlNet能够基于骨架姿势直接生成,但在修改源运动时,由于噪声(源)和条件(参考)之间的矛盾信号,它会遇到挑战。

2024-06-05 15:49:30 1112

原创 把你编辑进大片--虚拟拍摄工作流

这篇文章是翻译的立陶宛兄弟的一个制作工作流程。这块只是原本的翻译了他用AI工作制作的工作流程,已经很清晰简洁。后续有需要尝试搭建整条完整工作流,准备好素材输入,一步生成即可。先看看效果:# 实现。

2024-05-30 13:05:35 922

原创 用大模型搭建一个自己的新闻小助手

这篇文章选择用字节开放的“扣子”编排工具来实现,DIfy、autoagent、chatglm、langflow理论上讲都可以实现。但是扣子目前提供的工具插件、以及工作流我觉得是比较容易上手的。并且很多插件是免费使用、把各种API使用需要的权限申请和配置问题解决了。所以这次实践选择用“扣子”来实现。

2024-05-28 19:04:59 881 1

原创 Learn to Paint 光栅图转矢量图生成

https://github.com/liangwq/Chatglm_lora_multi-gpu/tree/main/APP_example平滑矢量图形综述:表示、创建、光栅化和图像矢量化的最新进展无偏扭曲区域采样在可微分渲染中的应用可微分矢量图形光栅化用于编辑和学习图片逐层矢量类人笔触的模型风格化绘画CLIPDraw:通过语言-图像编码器探索文本到绘图合成根据参考风格进行矢量图绘制基于语义感知的对象草图绘制具有不同类型和抽象级别的场景素描通过潜在扩散模型实现文本引导矢量草图合成使用扩散

2024-05-23 10:04:54 786

原创 使用神经实现路径表示的文本到向量生成

给定一个文本提示,我们的目标是生成一个与文本提示的语义一致且表现出令人满意的路径属性和与人类感知一致的分层结构的SVG。由于SVG由一组路径组成,表示为SVGPath1Path2PathmSVGPath1Path2...Pathm​,我们的目标是根据文本提示TTT通过以下方式优化mmm条路径:神经路径表示学习(第4节)路径几何由连接的三次贝塞尔曲线组成。我们的目标是通过将每条路径映射到一个表示为zzz。

2024-05-22 10:12:28 262

原创 使用扩散模型进行文本引导的SVG生成

图7:展示我们SVGDreamer生成的结果的可编辑性的例子。这份补充材料被组织成几个部分,提供了与我们在SVGDreamer方面的工作相关的额外细节和分析。在A部分,我们将展示SVGDreamer的更多定性结果,展示它能够生成具有高可编辑性、视觉质量和多样性的SVG。在B部分,我们将展示SVGDreamer在海报设计和图标设计方面的潜在应用。在C部分,我们将提供SVGDreamer的更多实现细节。在D部分,我们将解释如何在SIVE提示中识别语义对象。

2024-05-21 09:57:46 455

原创 通过潜在扩散模型实现文本引导矢量草图合成

在A部分,我们提供了DiffSketcher的实现细节。在B部分,我们对我们的DiffSketcher与其他两种文本到SVG方法,即CLIPDraw[7]和VectorFusion[13]进行了定性比较。我们比较了这些方法生成的结果,并从视觉质量和语义一致性方面分析了差异。在C部分,我们比较了由我们的DiffSketcher生成的草图和直接从LDM(即Stable Diffusion[30])中采样的草图,并分析了它们在风格上的差异。在D部分,我们进行了感知研究,以评估生成的草图的真实性。

2024-05-18 08:50:35 944

原创 具有不同类型和抽象级别的场景素描

在本文中,我们提出了一种方法,可以将给定的场景图像转换为使用不同类型的抽象和多个抽象级别的素描。我们区分了两种类型的抽象。第一种是考虑素描的保真度,从更精确地描绘输入到更松散的描绘,其表现方式有所不同。第二种是根据素描的视觉简洁性来定义,从详细描绘到稀疏素描。通过将两个抽象轴进行显式解耦(每个轴有多个级别),为用户提供了额外的控制,使他们能够根据个人目标和偏好选择所需的素描。为了在给定的保真度和简化级别下形成素描,我们训练了两个MLP网络。

2024-05-17 11:57:15 668

原创 基于语义感知的对象草图绘制

抽象是素描的核心,因为线条画的简单和最小化特性。抽象涉及识别对象或场景的基本视觉属性,这需要语义理解和对高级概念的先验知识。因此,抽象表现对艺术家来说是具有挑战性的,对机器来说更是如此。我们提出了CLIPasso,这是一种能够实现不同抽象程度的对象素描方法,通过几何和语义简化来指导。虽然素描生成方法通常依赖于显式的素描数据集进行训练,但我们利用了CLIP(Contrastive-Language-Image-Pretraining)的显著能力,从素描和图像中提取语义概念。

2024-05-17 11:56:01 635

原创 基于语义感知的对象草图绘制

抽象是素描的核心,因为线条画的简单和最小化特性。抽象涉及识别对象或场景的基本视觉属性,这需要语义理解和对高级概念的先验知识。因此,抽象表现对艺术家来说是具有挑战性的,对机器来说更是如此。我们提出了CLIPasso,这是一种能够实现不同抽象程度的对象素描方法,通过几何和语义简化来指导。虽然素描生成方法通常依赖于显式的素描数据集进行训练,但我们利用了CLIP(Contrastive-Language-Image-Pretraining)的显著能力,从素描和图像中提取语义概念。

2024-05-16 11:27:51 388

原创 根据参考风格进行矢量图绘制

利用机器学习根据给定的文本描述生成图像的技术已经取得了显著的进步,例如CLIP图像-文本编码器模型的发布;然而,当前的方法缺乏对生成图像风格的艺术控制。我们提出了一种方法,用于为给定的文本描述生成指定风格的绘图,用户可以通过一个样本图像来指定所需的绘图风格。受到艺术理论的启发,该理论认为在创作过程中风格和内容通常是不可分割的,我们提出了一个耦合的方法,称为StyleCLIPDraw,通过在整个过程中同时优化风格和内容来生成绘图,而不是在创建内容后应用风格转移。

2024-05-15 10:01:33 409

原创 CLIPDraw:通过语言-图像编码器探索文本到绘图合成

本工作介绍了 CLIPDraw,这是一种基于自然语言输入合成新颖绘画的算法。CLIPDraw 不需要任何训练;相反,它使用了一个预先训练好的 CLIP 语言-图像编码器作为衡量标准,以最大化给定描述与生成绘画之间的相似度。关键的是,CLIPDraw 在矢量笔触上操作,而不是像素图像,这一限制使得绘画倾向于更简单的、人类可识别的形状。

2024-05-14 14:41:35 983 1

原创 类人笔触的模型风格化绘画

图2展示了我们方法的概览。给定一个空的画布ℎ0,我们逐步绘制并叠加在每一步渲染的笔画。在每一步绘制中,一个训练好的神经渲染器𝐺接受一组笔画参数𝒙𝑡(例如,形状、颜色、透明度和纹理),并产生一个笔画前景𝑠𝑡和一个alpha蒙版𝛼𝑡。然后我们使用软混合来混合画布、前景和alpha蒙版,并确保整个渲染过程是可微分的。软混合定义如下:其中(𝑠𝑡, 𝛼𝑡) = 𝐺(𝒙𝑡)。我们最终从所有步骤中收集笔画参数,并通过在笔画参数空间内搜索来优化它们。

2024-05-13 14:26:54 1429

原创 图片逐层矢量化

图像光栅化是计算机图形学中一个成熟的技术,而图像向量化,即光栅化的逆过程,仍然是一个主要的挑战。最近,基于深度学习的先进模型实现了向量化和向量图的语义插值,并展示了生成新图形的更好拓扑结构。然而,深度模型难以推广到域外测试数据。生成的SVG文件也包含了复杂且冗余的形状,这在进一步编辑时并不十分方便。具体来说,图像中的关键逐层拓扑结构和基本语义仍然没有得到很好的理解和充分的探索。在这项工作中,我们提出了逐层图像向量化,即LIVE,以将光栅图像转换为SVG文件,并同时保持其图像拓扑结构。

2024-05-11 11:26:40 710

原创 字就是图,实现语义排版

“字即图”是一种语义排版技术,其中的单词插图展示了单词意义的可视化,同时保持了其可读性。我们提出了一种自动创建“字即图”插图的方法。这项任务极具挑战性,因为它需要对单词的语义理解以及如何在视觉上令人愉悦且清晰地描绘这些语义的创造性想法。我们依赖于最近大型预训练语言-视觉模型的卓越能力,将文本概念视觉化。我们专注于简单、简洁、黑白的设计,以清晰地传达语义。我们故意不改变字母的颜色或纹理,也不使用装饰。我们的方法通过预训练的Stable Diffusion模型指导,优化每个字母的轮廓以传达所需的概念。

2024-05-10 10:27:10 1033

原创 可微分矢量图形光栅化用于编辑和学习

我们希望通过微分矢量光栅化过程并启用基于梯度的优化来弥合矢量和光栅图形之间的差距。使这成为可能的关键见解是,虽然矢量形状——用指示函数表示——不是直接可微分的,但应用抗锯齿可以平滑不连续性。这使得抗锯齿光栅化图像相对于矢量形状参数是可微分的(图2)。在通过光栅化进行微分时需要特别小心,因为不同的抗锯齿策略需要不同的梯度实现。根据我们选择的抗锯齿技术,我们通过积分形状边界来考虑不连续性,或者通过分析地积分被积函数来评估形状参数的梯度,这需要做出简化假设。

2024-05-09 10:20:58 499 3

原创 平滑矢量图形综述:表示、创建、光栅化和图像矢量化的最新进展

平滑矢量图形领域探索了轻量级图像表示的表示、创建、光栅化和自动生成,常用于可缩放图像内容。过去几十年中,出现了多种概念性方法来表示具有平滑渐变的图像,每种方法都引发了独立的研究线索,包括流行的梯度网格和扩散曲线。随着计算模型的成熟,数学描述开始分歧,文章开始集中于子问题,如矢量图形的表示和创建,或者从光栅图像的自动矢量化。大多数工作都集中在特定的数学模型上。通过这篇综述,我们使用一致的符号描述了已建立的计算模型,以促进知识的进一步传递,利用每个领域的最新进展。

2024-05-08 12:16:14 996

原创 无偏扭曲区域采样在可微分渲染中的应用

图1. 可微渲染计算光传输方程的导数。为了处理可见性的存在,最近的基于物理的可微渲染器需要显式地找到边界点[Li等人2018;Zhang等人2020],或者通过启发式方法近似边界贡献[Loubet等人2019]。我们从第一原理出发,开发了一个无偏估计器,通过内部(区域)样本计算边界贡献。我们的方法可以轻松地与现有的重要性采样方法集成,并计算准确且低方差的梯度。例如,边缘采样方法[Li等人2018]发现很难一致地采样软反射中对导数有贡献的边界点,尤其是因为场景的复杂性很高。

2024-05-07 18:22:54 685

原创 带文字海报流程自动化

上面代码实现,根据把海报生成的各模块做了封装,并利用封装了自动化流程。让这条海报生成模块可以根据用户一键生成期待的海报,这只是一个基本流程封装,用户可以根据自己的需要调整每个模块实现,让生成海报符合自己需要。现在流程只允许用户输入文字描述生成海报,大家如果感兴趣可以对这条链路改造。允许用户输入参考的图,生成类似的海报;图片生成模块封装,根据上面生成的prompt调用图片生成后台服务生成图片。根据用户输入生成prompt中抽取出文字排版的信息对文字排版。根据生成图片,排版好的文字合成海报模块。

2024-05-04 11:32:43 477

原创 用大模型生成带文字的海报

这篇文章介绍如何利用VLM+diffusion模型来搭建一条文本生成海报的链路。搭建这条链路有两个应用:1.实际的业务中需要批量生产文字+图海报可以用,2.可以用来造训练数据。首先介绍下这篇文章的整体框架安排:1.生图模块2.字排版模块3.图文混合模块4.图审核验证模块。

2024-04-30 15:46:01 1233 2

原创 物理学视角讲解diffusion生成模型——隐扩散模型

https://zhuanlan.zhihu.com/p/692996885https://zhuanlan.zhihu.com/p/693255617前面两篇文章介绍了扩散过程,同时实现了1维、2维混合高斯扩散、逆扩散,通过模型预测得分函数来实现逆扩散推理。这个章节介绍工业界使用的文本生成图扩撒模型:stable diffusion。后面章节会将上述每个部分的一些内容代码实现,到最后将拥有一个运行中的类Stable-Diffusion模型。让我们从正向扩散开始。在最简单的情况下,相关的扩散方程是:K

2024-04-21 12:53:10 1124

原创 物理学视角讲解diffusion生成模型——混合高斯扩散模型

首先,让我们写下一个合理的目标函数。假设我们有一些参数化的得分函数sθxtsθ​xt,它依赖于一组参数θθ。我们希望准确地近似所有x\mathbf{x}xJθ?21​∫dxdtsθ​xt−∇x​logpxt2这个目标函数的问题在于它没有优先考虑任何特定的x\mathbf{x}x值。Jθ?12∫dxd。

2024-04-18 18:06:42 1006

原创 物理学视角讲解diffusion生成模型——数学基础和一维度实现

从物理学的视角来看扩散过程模型。之所以整理这个系列是因为现在大部份讲生成模型的教程都是直接从加噪、去噪、然后代码实现角度来讲。然而为什么要这么加噪、去噪、为什么要高斯拟合,如果我不这么做会怎么样,后续我要优化我的代码要从那下手呢。这些原理层面的东西基本没有讲,这就相当于给了一套生产流程,我们并不知道这套流程是怎么设计背后思想是什么。我们后续碰到问题如果要升级改造这个流程和链路要从何下手呢。要怎么接续上这套流程的设计思路呢。所以这个系列就是从这个视角切入,来讲解物理学家视角的扩散过程。以及当时为什么选择了扩散

2024-04-17 16:35:05 1189

原创 人形机器人系列——硬件介绍

人形机器人是多领域交叉技术的产物,主要由三大系统组成:感知系统、决策系统和执行系统。感知系统感知系统是人形机器人获取外界信息的途径,主要由各种传感器组成。其中,视觉传感器用于获取图像信息,如摄像头、激光雷达等;触觉传感器用于感知触碰和压力,如力/力矩传感器、声学传感器等。这些传感器收集到的信息为机器人的决策和执行提供基础。决策系统决策系统是人形机器人的大脑,负责处理和决策各种信息。它由芯片和算法组成。芯片是硬件基础,提供计算能力;算法是软件基础,用于处理和分析传感器收集到的信息,并做出相应的决策。执行系统。

2024-04-11 15:05:47 2295

原创 人工智能产业应用--具身智能

所 以,往更高频段上走是必然选择,其中D band(110~170GHz)具有未被开发应用的超 宽频带,比如当前已有在研究的140G频段, 具有较为适宜的大气窗口,传播受到的衰减 较小,而且波长减小一半,可以在有限的空 间,实现128T128R的超大天线阵列成像雷 达,从而达到中低等线数激光雷达的分辨能 力。然而,随着技术的进步,我们开始尝试一种全新的探索——“跳出缸中脑——虚实结合”,尤其在具身智能的领域中,大语言模型(如GPT系列)与现实环境结合的尝试,为人工智能的应用开辟了新的道路。

2024-03-31 12:57:35 1810 1

原创 人工智能在产业中应用--生成智能

1.视频时长可变2.视频长宽比可变3.可以根据给定文本生成视频4.可以根据给定的图生成视频5.可以根据给定视频前向、后向生成视频6.可以为给定的两段视频生成中间衔接视频7.可以对视频编辑8.长时间跨度角色一致。

2024-03-28 20:02:25 817

crf++使用工具包

crf++使用工具的详细介绍 模版的制定 crf咋各种模型中的使用案例demo

2018-08-02

电子书扫描,完整版

大数据比较热门的hadoop实战全书,完整扫描版

2014-09-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除