- 博客(9)
- 收藏
- 关注
原创 音频生成技术探索与淘宝域实践
在过去的几年团队持续以技术驱动产品和商业创新,在给业务创造价值的同时,也在Agent、可控图文、视频生成,多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索,在NIPS,CVPR,ICLR等顶会发表了数十篇论文,欢迎对团队技术工作感兴趣的同学进行交流或者加入我们。此外,收集的数据质量对于最终合成语音的效果有着决定性的影响,优质的训练数据对于模型的效果至关重要。但是,随着规模的增大数据集的质量也出现了一定程度的下降,数据集中出现了噪音、多人对话的音频。这样的交叉验证进一步保障了转录文本的准确性。
2025-03-31 19:20:39
853
原创 淘宝客户端动态化页面搭建
而且由于需要携带的信息变多,协议包大小也会有所增加。业务可以通过LifecycleManager.registerLifecycle注册页面的生命周期监听器,对外暴露的生命周期包括系统生命周期(Android onCreate/onDestroy,iOS didAppear/disAppear等),以及自定义的一些页面生命周期切面,比如网络请求、数据处理、预加载等切面。虽然页面整体布局方式大致一致,但是各个版本之间的代码基本是割裂的,如果需要升级协议,每次的工作量都是巨大,而且切流过程也是比较复杂。
2025-03-28 15:07:19
1208
原创 技术人的大模型应用初学指南
基于已有开源大模型进行微调训练,如果采用预训练的方式对模型的所有参数都进行训练微调,由于现有的开源模型参数量都十分巨大,如最新千问72B模型(qwen/Qwen1.5-72B-Chat)有720亿参数,对所有的参数都进行处理,那GPU资源成本会非常高,可能高达数百万每年,为了解决这个问题,社区提出了大模型微调的概念:PEFT (Parameter-Efficient Fine-Tuning),即对开源预训练模型的所有参数中的一小部分参数进行训练微调,最后输出的结果和全参数微调训练的效果接近。
2025-03-26 15:30:40
1002
原创 AI赋能:大模型创新的模板生成与内容填充
在过去的几年团队持续以技术驱动产品和商业创新,在给业务创造价值的同时,也在Agent、可控图文、视频生成,多模态统一大模型等最前沿的技术领域也有着广泛布局和深度探索,在NIPS,CVPR,ICLR等顶会发表了数十篇论文,欢迎对团队技术工作感兴趣的同学进行交流或者加入我们。图3-3展示给定一个非表格类模板,以及两个充电宝的商品信息,模型首先会对提供的 HTML 模板进行分析,从给定的商品信息中提取模板填充所需要的素材(标题、副标题、段落标题和正文)等,然后进行准确的、自适应的内容填写。
2025-03-17 15:27:50
641
原创 淘宝直播AI提效探索的一些心得
这个案例取自服务端代码生成项目上,其实内部的aone copilot在通用任务上做的非常好用了,官方统计的采纳率也达到了25%,是个非常不错的code copilot的产品,但是对于业务侧的开发来说,这类copilot生成的代码,属于基础实现代码,因为不太能很好的结合当前业务下沉淀的服务、方法来做代码生成,因此我们需要把这部分所谓的服务、方法、工具等接口信息和使用case给到LLM,它才能结合这样的context去做最终代码的生成;随着你继续预测更多的词,这些小比例的错误会累积起来,出错的可能性也会增加。
2025-03-14 14:50:06
1076
原创 多模态自动布局技术发展及其在淘内内容场的应用
作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。过去一年,我们通过在视频生成、图文联合生成等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AIGC内容生成技术总结》是我们摸索出的一部分实践经验,我们将开启一段时间的内容AI专题连载,欢迎大家一起交流进步。第一篇《淘宝内容AI团队2024年8...
2025-03-12 15:27:05
718
原创 MLLM在电商域互动内容生产的实践
作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。过去一年,我们通过在视频生成、图文联合生成等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AIGC内容生成技术总结》是我们摸索出的一部分实践经验,我们将开启一段时间的内容AI专题连载,欢迎大家一起交流进步。第一篇《淘宝内容AI团队2024年8...
2025-03-07 16:20:32
839
原创 大模型时代的视频动静态封面生产方案及业务实践
作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的...
2025-03-05 16:36:29
1097
原创 淘宝全新图生视频大模型“淘宝法象”,助力商家降本增效
作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的...
2025-03-03 15:26:54
1390
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人