播客以语言交谈为主,是大语言模型AI 可以大展拳脚的地方,比如播客简介,播客节目笔记(show notes)的自动化生成,播客节目单自动化推荐等等。笔者做了一些探索性实验工作,结果发现,在现有播客的文本描述(通常称为播客的元数据)基础上实现AI 推荐是不理想的。这主要是现有的播客节目的文本元数据质量参差不齐,大模型难以做矢量搜索和内容生成。
播客元数据存在的问题
目前播客存在的问题:
- 播客节目的名称太长,夹杂着各种符号,不适合语音播报
- 播客的介绍不规范
- 介绍过短,与内容不贴切。
- 节目笔记中夹杂着许多广告,宣传性信息。容易误导AI 大模型
从语音出发
据统计,全世界有几百万个播客节目。要求如此之多的播客主改进元数据是不现实。我们尝试直接从播客的语音生成节目文本,通过AI大语言模型生成节目简介和节目笔记,尽管可能没有人工编写的文字生动,优雅和富有感召力。但是至少内容比较全面。
具体的流程
- 将播客的语音文件转换成为文字稿
- 将文字稿生成一个节目简介
使用工具
- 百度简单记听
- 百度智能云语音识别_语音识别技术_百度语音识别-百度AI开放平台 (baidu.com)
- 百度文心一言
使用过程
下载了播客“商业就是这样”的一期节目《Vol.191:2024年度话题公司:胖东来》,它是m4a 格式文件
Step 1 由百度简单记听在线语音转文字。导出了文字稿。
胖东来走红与经营分析纪要
基本信息
会议时间:未提及相关信息
会议地点:未提及相关信息
参会人:向文杰, 葛老师
会议主题:胖东来走红与经营分析
会议纪要
新年首期节目,葛老师主动请缨
新年第一期节目,咕鲁米老师作为老朋友再次参加。葛老师主动请缨,早在去年11月底就定下了选题,并表示要来节目上说两句。虽然兴奋劲已过,但葛老师还是怒写了一万多字的逐字稿。
今天节目主角:胖东来公司
要聊的2024年度话题公司是胖东来。胖东来在2024年给中国零售界掀起大水花,从行业和民间角度都形成了各种讨论,不断登上热搜。节目将探究这当中到底发生了什么。
胖东来公司的初次印象与再度热议
我第一次听说胖东来是在几年前杂志选题会上,当时新零售是热门概念。今年上半年,永辉宣布让胖东来调改后,大家又兴奋讨论了一番。但当时我对胖东来兴趣一般。
葛老师接题的关键出发点:名创优品与永辉
葛老师接题的关键出发点是名创优品母公司俊才国际控股永辉后,叶国富表示要去许昌看胖东来,并照着胖东来做永辉。这引发了葛老师对胖东来到底有多厉害的好奇。
永辉的经营状况与胖东来的对比
永辉去年因业绩不佳关了全国20%左右的门店,但截至2024年年底全国还有超过800家。杂志在2024年十月份做了一篇永辉的研报。在做年终特刊时,胖东来已成为绕不过去的公司。
葛老师许昌之行与节目内容预告
葛老师去了许昌进行实地探访,并与记者一起写了12000字的报道。今天的节目将基于葛老师的许昌之行,结合对胖东来的报道和永辉的研报,试图捋清楚胖东来是怎么回事。
永辉能否学会胖东来的经营模式
讨论永辉超市是否能学习胖东来超市的经营模式,葛老师将分享胖东来的见闻。
胖东来超市的装修与产品陈列评价
葛老师认为胖东来超市的装修、产品陈列、动线规划及选品类似上海中高档超市水平,与山姆和costco的仓储型模式不同。
胖东来在低线城市的出色表现
胖东来在许昌等低线城市的表现出色,其天使城门店成为网红打卡地,店内深色系视觉、适中灯光、良好动线规划及细节设计,展现出高级感和人性化。
胖东来超市的便捷与人性化设计
胖东来超市提供储物柜、多种购物车、生鲜区配备手套和洗手池等便捷设计,注重管理日常工作,卖场值班经理和部门负责人信息透明,方便消费者随时联系。
胖东来超市的客流量与生意状况
胖东来超市客流量大,尤其在今年消费环境下仍表现强劲,吸引大量外地游客,成为许昌的繁荣景象。
胖东来闭店日与市场影响
胖东来每周二部分门店闭店,将市场留给同行,但网约车司机表示闭店日生意变差,外地游客增多,胖东来成为许昌必打卡景点。
胖东来走红历程与关键节点
胖东来的走红历程可分为两个阶段,2014年至2022年为长期发酵过程,影响力限于特定圈子;2022年至今为快速破圈过程。其中涉及盛和署组织、游学业务等关键节点。
盛和署与胖东来游学业务
盛和署是一个学习稻盛和夫的企业家组织,定期组织国内外企业游学。胖东来成为游学对象,其服务好员工、工资高的经营模式在民营企业家中传说。
胖东来游学业务的火爆
太和文旅作为组织胖东来游学的头部公司,八年间组织6700家企业超五万人次游学。游学团在胖东来现场四处可见,对购物体验产生一定影响。
胖东来超市成为游学热门及其官方态度
商务着装的中年男子结伴购物,胖东来超市如鱼塘般吸引商业记者。官方未直接参与游学,但默许前员工以此作为卖点进行讲课,游学团成员多为喜欢消费并分享物料的企业家。
联商东来商业研究院成立及影响
2022年三月,联商东来商业研究院成立,由联商网董事长庞晓伟任院长,胖东来创始人于东来任首席导师。随后启动第一届种子班,多家区域性商超老板参与,学费高达50万元。
联商网与胖东来的合作及推广
联商网以行业媒体为基础,做资源对接生意,创始人庞小伟零售界资源丰富。庞小伟在2021年认识于东来后成为其信徒,联商网倾注媒体资源全面追踪报道胖东来相关资讯,并出书《美好之路》。
胖东来天使城广场开业及其营销策略
2023年一月份,胖东来天使城广场开业,总投资35亿,成为许昌最高端购物中心。开业初期进行大量社媒投放,2023年下半年效果显现,抖音平台相关账号获得高点赞和转发。
胖东来商学院种子班及帮扶计划
胖东来商学院种子班展开帮扶计划,无偿甚至自费调改其他超市,作为实践课供学员学习。2024年,长沙步步高超市和永辉超市先后接受胖东来调改,引发广泛关注。永辉调改副总指挥为联商东来研究院成员。
胖东来登上超市TOP榜及盈利能力
2024年七月份,胖东来首次登上中国超市top 100榜,排名第32位,销售额46亿。联商网解读其单店盈利能力超过业界所有商超,净利润碾压头部同行,引发媒体热议。
胖东来走红之路的小结及遗漏节点
胖东来走红之路分为两个阶段,第一阶段在民营企业家圈子成为游学目的地,关键角色是盛和蜀;第二阶段在全社会引发关注,核心推手是联商网。除已提到的两个关键节点外,还有一个遗漏的走红节点。
胖东来公司的经营模式和调整策略
胖东来调整卖场动线,提升卖场品相,做大生鲜区域,增加自有品牌,取消后台费用,提升员工福利和服务质量。其调改方案包括同一套300三板斧,但不同地域规模和品牌基础是否适用同一方式有待商榷。胖东来的经营核心包括做大生鲜、大单品和自有品牌,这是近年来商超零售行业的主流策略。
胖东来经验被形成课程的原因
胖东来的业绩好,因此其经验被形成课程来教授。胖东来业绩的真实性存在模糊,因其非上市公司,没有公开的财务数据。有报道称其2023年销售额为107亿,超市部分营收46亿,但数据来源主要是胖东来自身。采访中获得了一份胖东来核心部门高管的述职报告,提供了另一些数据。
胖东来超市2023年的经营状况
胖东来许昌的十家超市及线上商城2023年销售总额为23.72亿元,自营的毛利率是18.6%,净利率是2.7%。计入烟柜后总营收约28亿元,同比增幅超过50%。其中九家超市销售额超过一亿,网红店天使城超市销售额达四亿。但公开数据与内部数据存在差异,难以判断哪个更准确。以27%的净利率计算,2023年超市部门盈利6400多万,平均单店盈利600多万。
胖东来对标costco和山姆及新品情况
胖东来在内部报告中明确将costco和山姆列为对标对象,并推出了网红单品策略,如精酿啤酒和网红大月饼等。这些网红单品都是近两年才上线的,产业物流园和中央厨房也都是2022年才投入运营的。这表明于东来本人非常敏锐,能够抓住流量机遇。
胖东来生鲜战略及亏损情况
胖东来超市生鲜品类销售额占比超一半,但毛利率最低,处于净亏损状态。蔬菜是口碑最好的品类之一,进场检验标准高,被视为当地农药检验合格的标准,但蔬菜部门净利率为-176%,表现最差。肉蛋菜奶作为民生消费,经常是超市的引流品类,并不追求高毛利,甚至故意亏钱,以此建立食品安全和品质口碑。
胖东来其他领域盈利情况及品牌价值
胖东来熟食、水产、烘焙等品类单价较高,与许昌另一家连锁超市九地超市相比,价格明显高出。胖东来被定位为当地高端消费场所,虽然价格贵,但因其可靠而受到消费者信赖,成为许昌人的日常。胖东来用近20年时间建立消费者信赖感,从1999年起就承诺不满意就退货。
胖东来多元化业态及营收情况
胖东来除了超市外,还涉及电器、服饰、珠宝、餐饮、医药、电影、眼镜、茶叶、图书等多业态。集团营收是商超部分营收的两倍左右,另一半主要来自商业地产部分的租赁。胖东来在许昌有足够的利润空间来支撑高薪福利和无条件售后,这种模式在许昌等内陆城市可能比一线城市更适合培育。
胖东来市场扩张及开店成本问题
胖东来一直未走出河南,只在新乡尝试过,但因郑州开店成本和人力成本太高而收回。2019年前胖东来在许昌未开新店,之后开了云顶店、金三角店、北海店和金汇店,但后三家店业绩不如预期。云顶店投资回报率最高,超过60%,而金汇店一直处于亏损状态。
胖东来员工薪酬及市场统治力
胖东来员工薪酬较高,2023年超市部门一线员工平均工资实发到手约6400元,部分超过一万。有管理职能的员工薪酬更高,单店店长平均工资35000元。在许昌,胖东来工资比本地公务员高,员工能开心上班。但在一线城市,超市老板很难提供同等薪酬水平。胖东来在许昌零售市场拥有相当统治力,实现了口碑、销售、服务和员工高福利的正循环。但其优秀业绩是否远超同行存疑,成功花了20多年积累,且模式成功先决条件难以复刻,对财务压力的上市公司来说,是榜样但未必是模板。
永辉学习胖东来的效果与名创优品的收购
叶国富对永辉的学习效果表示肯定,名创优品收购永辉的原因包括永辉价格便宜、名创优品账上现金充足且低成本融资能力强、永辉现金流可观且预期未来会有拐点。名创优品出于业务战略考虑,认为收购永辉可以应对不确定性,穿越经济周期。
永辉过去三年的经营状态与亏损情况
永辉从2021年开始出现亏损,营收和净利双降,门店竞增为负,最大一波关店在2024年。截至2024年十月底,门店总数从1000家降到800家出头。2023年亏损13亿元,同比扭亏50%。永辉是生鲜业态的开创者,生鲜在销售额中占比约45%,自营占比超九成,供应链能力强。
永辉的历史尝试与亏损原因
永辉在新零售冲击下做了多种尝试,如永辉生活社区便利店、超级物种等,但现已大部分关店或消失。永辉的亏损与其近年的尝试紧密相关,尤其是在前置仓生鲜电商、高端大店、社区团购等方面的探索。
永辉找胖东来合作的可能原因与调改效果
永辉找胖东来合作的原因可能与资本线索有关,步步高作为胖东来调改对象,其背后的投资公司与永辉有股东关联。永辉参与调改的店铺支付客流和销售额显著增加,调改初见成效。但长期看效果仍需观察,胖东来调改要求去掉非自采商品的后台费用,对永辉营收有影响。
胖东来对永辉的长期影响与永辉的学习挑战
胖东来对永辉的长期影响尚不明确,永辉面临诸多具体问题,如胖东来调改要求影响营收、高薪政策增加员工成本等。永辉能否学到胖东来的所有经验尚待观察,且胖东来热度下降后,其自有品牌也未必能一直大卖。
百度还有一个播客转文字的功能,只要输入播客节目的Url ,它可以自动转换成文字稿。结果与人工输入差不多。
下面我们还会尝试百度语音API 来转换语音。
Step2 文心一言输出节目简介
提示词:
这是一篇播客的文字稿,请写一个节目简介
文心一言回答:
节目简介:
本期播客节目将深入探讨胖东来公司在2024年成为中国零售界焦点的背后故事。节目通过详细的分析和实地探访,揭示了胖东来如何从一家地方性超市成为全国瞩目的焦点,其独特的经营模式、人性化的设计、以及对员工的高薪福利政策等都成为了热议的话题。同时,我们也会对比永辉超市等竞争对手的经营状况,探讨胖东来模式的可复制性和对其他企业的启示。这是一次对胖东来走红历程和经营策略的全方位解读,为您揭示这家企业成功的秘诀。
语音直接产生播客的描述
1 使用百度语音转换成文本:
使用的语音文件
播客:商业就是这样:节目:餐饮”过冬“的三个故事。27分钟。
原本播客节目的简介
在2024年前11个月的社会零售消费总额中,餐饮业的同比增长优于大多数其他部门。但这是营收角度,如果从利润角度看,餐饮业降价过冬的趋势十分明显。但是降价不是说说那么简单,不同的餐厅、怎么降、降了能带来多少生意、降价之外,还有哪些求生手段,本期节目我们从三个案例入手,来看看餐厅如何过冬。
main
const axios = require('axios');
const AK = "Zt0LGHyixxxxxGWD4bOb"
const SK = "PbqnVCXhxxxxxdSFWBYSPOslmPrX"
async function main() {
var options = {
'method': 'POST',
'url': 'https://aip.baidubce.com/rpc/2.0/aasr/v1/create?access_token=' + await getAccessToken(),
'headers': {
'Content-Type': 'application/json',
'Accept': 'application/json'
},
data: JSON.stringify({
"speech_url": "https://media.xyzcdn.net/6022a180ef5fdaddc30bb101/lkvzYBGOA5rSf-YehOKIn-VYlNHM.m4a",
"format": "m4a",
"pid": 80001,
"rate": 16000
})
};
axios(options)
.then(response => {
console.log(response.data);
})
.catch(error => {
throw new Error(error);
})
}
/**
* 使用 AK,SK 生成鉴权签名(Access Token)
* @return string 鉴权签名信息(Access Token)
*/
function getAccessToken() {
let options = {
'method': 'POST',
'url': 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + AK + '&client_secret=' + SK,
}
return new Promise((resolve, reject) => {
axios(options)
.then(res => {
resolve(res.data.access_token)
})
.catch(error => {
reject(error)
})
})
}
main();
检查任务结果并存储文本文件
const fs = require( 'fs');
const axios = require('axios');
const AK = "Zt0LGHyxxxxxxDrHGWD4bOb"
const SK = "PbqnVCxxxxxxWjfdSFWBYSPOslmPrX"
async function main() {
var options = {
'method': 'POST',
'url': 'https://aip.baidubce.com/rpc/2.0/aasr/v1/query?access_token=' + await getAccessToken(),
'headers': {
'Content-Type': 'application/json',
'Accept': 'application/json'
},
data: JSON.stringify({
"task_ids": [
"678324c0d81df10001e0dc1b"
]
})
};
axios(options)
.then(response => {
console.log(response.data);
var doc=response.data.tasks_info[0].task_result.result.toString()
console.log(doc)
console.log(response.data.tasks_info[0].task_result.audio_duration)
fs.writeFileSync("textfile.txt",doc)
})
.catch(error => {
throw new Error(error);
})
}
/**
* 使用 AK,SK 生成鉴权签名(Access Token)
* @return string 鉴权签名信息(Access Token)
*/
function getAccessToken() {
let options = {
'method': 'POST',
'url': 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + AK + '&client_secret=' + SK,
}
return new Promise((resolve, reject) => {
axios(options)
.then(res => {
resolve(res.data.access_token)
})
.catch(error => {
reject(error)
})
})
}
main();
注意: 要复制task_ids ,它在上一个文件执行后输出。
产生的文本文件,大约9892 个字。
2 用大模型生成 summary
提示:
这是一个播客的文本内容,请编写一个播客的简介
文心一言的回答:
本期播客节目深入探讨了餐饮业在当前消费动力不足环境下的生存现状与挑战。节目以“餐饮业如何过冬”为主题,通过选取三个不同价格区间的餐厅案例——高端西餐厅、知名连锁餐厅西贝以及美食城内的低价档口,详细剖析了它们在面对市场变化时所采取的经营策略与调整。
首先,节目介绍了高端西餐厅在面对消费下滑时的应对措施,包括尝试降价吸引新客、调整菜单结构以及努力压缩成本等。然而,由于高价餐厅的特殊性和品牌认知度的影响,这些策略在实施过程中遇到了不少困难和挑战。
接着,节目以西贝为例,分析了人均百元左右的连锁餐厅在面对客流量下降、租金上涨等压力时的应对策略。西贝通过拓宽菜品和客单价区间、重点发展儿童餐以及提升员工薪酬福利等方式,努力维持和吸引顾客,同时收缩战线,减少新项目探索,专攻核心产品。
最后,节目关注了低价餐饮市场的变化。尽管这个区间相对受影响较小,但不同档口之间的生意差别巨大,非常考验细节管理。节目通过采访美食城内的档口经营者,揭示了低价餐饮市场的竞争态势和经营者们为了生存而做出的各种努力。
整个节目通过丰富的案例和深入的剖析,展现了餐饮业在当前环境下的艰难与不易。同时,也提醒了广大餐饮从业者要保持对行业的敬畏之心,做好亏钱的准备,并不断探索适合自身发展的经营之道。本期节目内容丰富、信息量大,对于关注餐饮业发展的听众来说,具有很高的参考价值。
你可以对比上面播客编写的节目简介。
OpenAI 的Whisper
Whisper 是openAI于 2022 年 9 月开源的语音转文本模型,它获得了开发者社区的极大赞誉,但运行起来也有些困难。现在,我们已通过 API 提供 large-v2 模型,该模型提供便捷的按需访问,价格为每分钟 0.006 美元。
使用OpenAI 的Whisper是openai在9月发布的一个开源语音识别翻译模型,它的英语翻译的鲁棒性和准确性已经达到了很高的水准,支持99种语言翻译
参考:
代码
import os
from openai import OpenAI
os.environ['OPENAI_API_KEY'] ="sk-ZqGx7uD7sHMyxxxxxxzUGGRwN23N9NbnqTbL"
os.environ['OPENAI_BASE_URL'] ="https://api.chatanywhere.tech/v1"
# Create an api client
client = OpenAI(base_url="https://api.chatanywhere.tech/v1")
# Load audio file
audio_file= open("sample2.mp3", "rb")
# Transcribe
transcription = client.audio.transcriptions.create(
model="whisper-1",
file=audio_file
)
# Print the transcribed text
print(transcription.text)
结果
500多字,质量不错。 不知为什么没有标点符号。mp3 文件不能超过20M(大约15分钟中文)
后面我们专门写一篇关于Whisper的博文。
结论
初步的尝试是令人满意的。下一步,我们尝试构建一个播客智能体(podcast Agent),实现上述流程的自动化。