论文不记之《Legible Compact Calligrams》

翻译于 2018-03-21 23:24:31 发布

· 318 阅读

·

0

·

论文不记专栏收录该内容

5 篇文章

订阅专栏

1、本文主要贡献

本文的主要贡献是首次提出清晰的紧凑画诗生成，另一个是从众包数据中得出的易读性度量。

2、大纲：

该算法通过由粗到细的方法，输入小写字母和轮廓图，自动生成具有语义的画诗。如下图所示：

a.路径生成：在最粗糙的处理层，本文将文本看作一个矩形并希望其以最小的形变适应图像的轮廓。即有足够的空间容纳这些文字，由此生成一条排放文字的路径。

b.字母校准：在这一层，本文需要沿着路径排列文字。从纯易读性和美学的角度讲，每个字母按空间划分成相同大小最合适，但这种朴素的解决办法没法适用于突出较大的地方，比如动物的腿。为了平衡可读性和适应性，本文使用字母的突出特征去适应形状轮廓中的突出点。

c.字母变形：考虑到近似的位置，缩放比例和所有字母的朝向，本文方法最精细的一步是将单个字母变形为最符合标准的同时保证它们的易读性。最大的挑战是没法评估变形对于可读性的影响，解决这个问题是本文的贡献之一，本文借鉴了从排版文献中想到的一些特征并使用众包输入学习他们的相对重要性。最后应用这个标准做参考。

3、总结：

本文的最终目的不是为了代替专业的艺术家，而是为他们提供辅助，所以本文的最终结果也是可以与使用者交互的。本文的限制和未来工作大致有以下几点：

a.需要有画诗模板，专业的艺术家会把模板的姿势也考虑进去，所以如果能根据文字更改画诗模板是未来的一个有趣的扩展。

b.可读性的潜在运用，本文提出的可读性模型可能适用于其他应用。

c.联合限制变形，类似本文根据对可读性的研究，可以看到一种联合变形概念的提出。

d.训练数据的限制，用于训练产生多种变形字母的数据只覆盖了一定的变形空间，如果有更多数据，可以使用更先进的工具，例如深度神经网络。

e.技术限制，一个主要的限制是本文假设布局路径是单一的低曲率线，无法自动生成覆盖多低曲率的优雅画诗，需要人工添加辅助线条。如下图所示：

f.未来工作：

(i)除了提供单词和图片，用户也可以只提供文字性的描述来生成画诗，例如用“a jumping tiger”代替图片。

(ii)计算可重复使用的字母形状或者分段可以用于输入的图形也是有趣的研究。

(iii)在愉悦视觉层面，进行两个画诗的形状到形状，字母到字母的变换也是未来有趣的工作之一。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。