清华系“仓颉”来袭:图形起源:用AI颠覆字体设计,推动大模型商业化落地

大模型如何落地?又该如何实现商业化?这一议题已成为今年科技领域的焦点话题。

在一个鲜为人知的字体设计赛道上,清华创业公司“图形起源”悄然实现了商业变现:他们帮助字体公司将成本降低了80%,生产速度提升了10倍以上。Canva可画平台上最受欢迎的前100套中文字体,大部分都是通过他们的算法生成的。

图片

图片

这个市场虽然规模较小,但需求却十分迫切。设计公司和字体公司长期以来深受版权费用的困扰。而图形起源凭借其在图形学和AI方面的技术优势,提供了人工无法匹敌的效率与精度。

接下来,让我们来看看他们是如何通过AI造字,发现并实现商业化的。

靠AI造字赚钱,提速10倍以上

首先,什么是字体生产?在传统的字体生产流程中,设计师通常需要手写完成整套字体的制作(最多近3万个字)。初稿完成后,还需逐字校对,这个过程往往需要数月,带来不小的成本开销。此外,由于依赖人工操作,字体的质量和风格一致性也难以保证。

正是在与客户交流时,图形起源团队发现了这一行业痛点,经过数月的研发,打造了一条全新的AI字体生产线。

但这不是简单套用大模型就能解决的。字体设计最大的挑战在于,它是一种矢量图形,能够在放大时保持清晰度。而现有的AI图像生成通常是位图,受像素限制。如何让AI生成矢量图,并理解字体的锚点和矢量曲线的含义,是其中的技术难点。

创始人史海天分享了他们的解决思路,整个流程分为四个阶段:

首先,使用传统的扩散模型生成位图;
接着,利用超分辨率模型将位图分辨率提升到最高;
然后,通过一种独特的算法,让AI理解“优质矢量设计”的标准,并基于这一标准优化模型,将位图转化为矢量图;
最后,训练一个专门用于检查错别字和字形结构的模型。

此外,他们还计划开发笔画拆分模型,进一步提升精度。

基于这些技术,他们实现了超越人类的效率和质量。例如,通过AI超分技术和AI矢量化处理,字体的细节在各种尺寸下都保持清晰,设计师可以在海报等大幅面场景中自如应用。

图片

客户只需制作前199个字,AI便能在两天内生成数万个字,并且不局限于简体,还包括繁体字、生僻字、以及日文、韩文、拉丁字母等多种语言文字。

在准确度方面,简单字形(笔画少于15)单次生成的错误率低于1%,复杂字形(笔画多于15)错误率也不到5%,远高于人工审校的水平。

目前,他们还打造了一个SaaS平台,整个交付过程可以在线完成,客户可以随时查看进度,甚至自己完成字体的生产过程,无需图形起源的人工干预。

据透露,目前他们已经生成了346套字体,累计4680244个字。

来自图形起源

图形起源成立于2020年底,由清华大学车辆学院毕业生史海天在硕士休学期间创办。在此之前,他们主要研发3D创作引擎,并完成了三轮融资,获得了五源资本和真格基金等机构的支持。彼时,他们的愿景是打造一个大众化的3D内容创作工具及社交平台。

如今,大模型技术的突破为他们带来了全新的机遇。通过大量资金和时间的投入,图形起源最终成功训练了两个大模型——一个用于识别,另一个用于生成,其目标是让AI生成的字体与人工设计难以区分。

字体行业的一个优势在于,数据相对齐全。例如,AI可以从一套字形中学习一半字,进而生成剩余的部分。如今,他们已经达到了商用交付的水平,每周可完成超过40套字体的交付,效率提升了数百倍。

当前的主营业务

图形起源的业务主要集中在两个方面:

图片

中文字库扩展:客户提供参考字体文件后,图形起源的AI会进行学习,生成风格统一的字形,整个过程在SaaS平台上进行。平台还支持人工校对、二次学习、批量生成等功能,以进一步降低错字率。

图片

跨语种风格迁移:他们的AI能够根据任意语种的字体生成其他语种的字形。目前支持中日韩、拉丁字母、希腊字母等,且已在小米应用商店销售。藏文、阿拉伯文等小语种也在测试中。

尽管大厂们在生产力领域激烈竞争,但在具体的细分场景下,创业公司往往可以找到更为灵活的切入点。图形起源在字体和排版等强需求领域的成功就是一个例子。

大模型应用的关键在于能否解决实际问题,而图形起源已经用他们的创新回答了这一命题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值