机器之心专栏
机器之心编辑部
来自华南理工大学、新加坡国立大学、香港理工大学以及琶洲试验室的研讨者们联合提出一种风趣的手写文字生成办法,仅需供给少数的参阅样本即可描摹用户的书写风格,然后生成契合该风格的恣意文字。
笔迹仿照 AI 的研讨布景
俗话说,见字如面,字如其人。比较板滞的打印字体,手写体更能体现书写者的个人特色。信任很多人都曾想象过,具有一套归于自己的手写字体,用在交际软件中,更好的展现自己的个人风格。
但是,不同于英文字母,汉字数量是极端巨大的,想要发明一套自己的专属字体价值非常昂扬。例如,最新发布的国标GB18030-2022中文字符集包括8万多个汉字。有报导称,某视频网站博主花了18个小时写完了7000多个汉字,中心耗费了足足13支笔,手都写麻了!
上述问题引发了论文作者的考虑,能否规划一个文字主动生成模型,协助处理专属字体发明价值高的问题呢?为了处理这一问题,研讨者想象提出一个会笔迹仿照的 AI,仅需用户供给少数的手写样本(大约 10 几张),就能提取笔迹中包括的书写风格(例如字符的巨细、歪斜程度、横宽比、笔画的长短和曲率等),而且描摹该风格去组成更多的文字,然后为用户高效组成一套完好的手写字体。
进一步地,论文作者从运用价值和用户体会两个视点动身,对该模型的输入和输出模态做了如下考虑:1. 考虑到序列模态的在线字体 (online handwritings) 比图画模态的离线文字 (offline handwritings) 包括更丰厚的信息(轨道点的详细方位和书写次序,如下图所示),将模型的输出模态设置为在线文字会有更广泛的运用远景,例如能够运用到机器人写字和书法教育上。2. 在日常日子中,比较经过平板和接触笔等收集设备获取在线文字,人们运用手机摄影获取离线文字愈加便利。因而,将生成模型的输入模态设为离线文字,用户运用起来会愈加便利!
总结起来,本文的研讨方针是提出一个风格化的在线手写文字生成模型 (stylized online handwriting generation method)。该模型既能描摹用户供给的离线文字中所包括的书写风格,又能依据用户需求在线生成内容可控的手写笔迹。
论文地址:https://arxiv.org/abs/2303.14736
代码开源:https://github.com/dailenson/SDT
首要应战
为了完结上述方针,研讨者们剖析了两个关键问题:1. 因为用户只能供给少数的字符样本,能否仅从这些少数的参阅样本中学习用户共同的书写风格呢?换句话说,依据少数的参阅样本描摹用户的书写风格是否可行?2. 本文的研讨方针不只需求满意生成的文字风格可控,还需求内容也可控。因而,在学习到用户的书写风格后,怎么将该风格与文字内容高效的结合,然后生成满意用户希望的手写笔迹?接下来让咱们看看这篇 CVPR 2023 提出的 SDT(style disentangled Transformer)办法是怎样处理这两个问题的吧。
处理方案
研讨动机 研讨者发现,个人笔迹中一般存在两种书写风格:1. 相同书写者的笔迹存在着一种全体上的风格共性,各个字符呈现出类似的歪斜程度和宽高比,且不同书写者的风格共性各不相同。因为这种特功能够用于区分出不同的书写者,研讨者们称其为书写者风格。2. 除了全体上的风格共性,来自同一书写者的不同字符间存在着细节上的风格不一致。例如,关于 “黑” 和 “杰” 两个字符,二者在字符结构上具有相同的四点水部首,但该部首在不同的字符中存在弱小的书写差异,体现在笔画书写的长短、方位和曲率上。研讨者们将这种字形上的纤细的风格形式称为字形风格。受启发于上述调查,SDT 旨在从个人笔迹中解耦出书写者和字形风格,希望提高对用户笔迹的风格仿照才能。
在学习到风格信息后,不同于以往的手写文字生成办法简略的将风格和内容特征进行简略的拼接,SDT 将内容特征作为查询向量,自适应的捕获风格信息,然后完结风格和内容的高效交融,生成契合用户预期的手写笔迹。
办法结构SDT 的全体结构如下图所示,包括双分支风格编码器、内容编码器和 transformer 解码器三部分。首要,本文提出两个互补的比照学习方针来引导风格编码器的书写者分支和字形分支别离学习对应的风格提取。然后,SDT 运用 transformer 的注意力机制 (multi-head attention) 对风格特征和内容编码器提取到的内容特征进行动态交融,渐进式的组成在线手写文字。
(a) 书写者风格比照学习 SDT 提出面向书写者风格提取的有监督比照学习方针(WriterNCE),将归于相同书写者的字符样本集合在一起,推远归于不同书写者的手写样本,显现地引导书写者分支重视个人笔迹中的风格共性。
(b) 字形风格比照学习 为了学习愈加细节的字形风格,SDT 提出无监督的比照学习方针 (GlyphNCE),用于最大化相同字符不同视角间的互信息,鼓舞字形分支专心学习字符中的细节形式。详细如下图所示,首要对同一张手写字符做两次独立的采样,获取一对含有笔画细节信息的正样本和,然后从其他字符中采样得到负样本。每次采样时,随机挑选少数样本块作为包括原始样本细节的新视角。样本块的采样遵守均匀分布,防止字符的某些区域被过度采样。为了更好的引导字形分支,采样进程直接效果于字形分支输出的特征序列上。
(c) 风格和内容信息的交融战略 获取了两种风格特征后,怎么将其与内容编码器学习到的内容编码进行高效交融呢?为了处理这一问题,在恣意的解码时间 t,SDT 将内容特征视作初始点,然后结合 q 和 t 时间之前输出的轨道点构成新的内容上下文。接着,内容上下文被视为 query 向量,风格信息作为 key & value 向量。在穿插注意力机制的交融下,内容上下文与两种风格信息顺次完结动态聚合。
试验
定量点评SDT 在中文、日文、印度文和英文数据集上都取得了最优异的功能,尤其是在风格分数指标上,比较之前的 SOTA 办法,SDT 取得了较大打破。
定性点评在中文生成方面,比较曾经的办法,SDT 生成的手写字符既能防止字符的崩坏又能很好的描摹用户的书写风格。得益于字形风格学习,SDT 在字符的笔画细节生成方面也能做的很好。
在其他言语上 SDT 也体现杰出。尤其在印度文生成方面,现有干流办法很简略生成溃散的字符,而咱们的 SDT 仍旧能够保持字符内容的正确性。
不同模块对算法功能的影响 如下表所示,本文提出的各个模块具有协同效果,有用提高了对用户笔迹的描摹功能。详细来说,书写者风格的参加提高了 SDT 对字符全体风格的仿照,例如字符的歪斜程度和长宽比等,而字形风格的参加改进了生成字符的笔画细节。比较已有办法简略的交融战略,在各项指标上 SDT 的自适应动态交融战略全面增强了字符的生成功能。
两种风格的可视化剖析 对两种风格特征进行傅里叶变换得到如下的频谱图,从图中调查到,书写者风格包括更多的低频成分,而字形风格首要重视高频成分。事实上,低频成分包括方针的全体概括,高频成分则愈加重视物体的细节。这一发现进一步验证和解说了解耦书写风格的有用性。
展望
我们能够经过笔迹 AI 发明自己的专属字体,在交际平台上更好的表达自我!
2025年4月17日晚,中心纪委国家监委网站发布音讯,依据党中心关于巡视作业的一致布置,到4月16日,二十届中心第五轮巡视完结进驻作业。
经党中心同意,二十届中心第五轮巡视将对河北省、山西省、内蒙古自治区、吉林省、浙江省、安徽省、江西省、河南省、湖北省、湖南省、海南省、四川省、云南省、甘肃省、宁夏回族自治区、新疆生产建设兵团展开惯例巡视,对云南省昆明市展开提级巡视,并会同有关省委巡视组织对长春市、杭州市、宁波市、武汉市、成都市等5个副省级城市展开联动巡视。
这是党的二十大以来,中心初次专门针对当地展开巡视。
4月8日,中共中心政治局常委、中心巡视作业领导小组组长李希到会全国巡视作业会议暨二十届中心巡视省(区、市)发动布置会着重,2025年是推进巡视全掩盖的要害一年,要进步政治站位、精心组织施行,保证获得实实在在成效。
当日会议上,中共中心政治局委员、中心巡视作业领导小组副组长石泰峰宣告了二十届中心第五轮巡视组长授权任职和使命分工决议。现在,各个中心巡视组组长人选现已发布。
中心纪委国家监委网站音讯称,被巡视区域已别离举行巡视进驻发动会。各中心巡视组组长作发动说话指出,要精确掌握政治巡视监督要点,环绕党中心关于被巡视区域的功能定位和战略布置,紧盯权利和职责,紧盯“一把手”和领导班子,紧盯大众反映激烈的问题,着力查找政治误差,推进处理杰出问题。
据悉,各中心巡视组将在被巡视区域作业2个半月左右,期间建立专门值勤电话和邮政信箱,首要受理反映被巡视党组织领导班子及其成员、下一级党组织首要担任人和要点岗位人员问题的来信来电来访,要点是关于违背政治纪律、组织纪律、廉洁纪律、大众纪律、作业纪律、日子纪律等方面的告发和反映。巡视组受理信访时刻截止到2025年6月23日。
党的二十大以来,中心已展开四轮巡视,时刻别离是在2023年4月、10月和2024年4月、11月。4月14日,中心纪委国家监委网站发布音讯,依据党中心布置,二十届中心第四轮巡视反应作业近来悉数完结。音讯称,中心巡视组收到反映一些领导干部的问题头绪,已按规则转中心纪委国家监委机关、中心组织部等有关方面处理。
界面新闻注意到,跟着中心巡视组连续进驻,多个被巡视区域已有官员被查。
4月17日下午,云南省纪委监委发布音讯称,昆明市政府原秘书长、一级调研员郭希林涉嫌严峻违纪违法,现在正承受昆明市纪委纪律检查;经云南省监委指定玉溪市监委统辖,正承受玉溪市监委督查查询。此外,昆明后勤服务保证有限公司董事长朱绍格涉嫌严峻违纪违法,现在正承受昆明市纪委监委纪律检查和督查查询。
此前在4月16日,中心纪委国家监委网站发布音讯,依据党中心关于巡视作业的一致布置,近来,中心第六巡视组巡视昆明市作业发动会举行。云南省委常委、昆明市委书记刘洪建表态称,这次巡视是对昆明的一次全面政治体检,昆明市要把诚实承受巡视监督作为坚决支持“两个建立”、坚决做到“两个保护”的政治查验,坚决遵守巡视作业组织,全力支持合作巡视组展开作业,坚决抓好问题整改。
中心第九巡视组进驻的湖北省也有官员被查。中心纪委国家监委网站4月15日发布音讯称,近来,中心第九巡视组巡视湖北省作业发动会举行。当日,湖北省纪委监委发布音讯,荆州市委书记吴锦涉嫌严峻违纪违法已被查。另据春风汽车集团有限公司纪委、湖北省纪委监委4月17日音讯,春风公司春风财物办理有限公司原总经理卢锋涉嫌严峻违纪违法也已被查。
此外,浙江省纪委监委4月16日通报,浙江省商业集团有限公司原总经理助理乐毅涉嫌严峻违纪违法,自动投案承受检查查询。甘肃省兰州市纪委监委4月17日通报,兰州市政务服务中心副主任李柏斌涉嫌严峻违纪违法被查。宁夏自治区石嘴山市纪委监委4月16日通报,石嘴山市应急办理局原党委副书记、副局长徐建军涉嫌严峻违纪违法被查。
界面新闻记者 | 翟瑞民2025年4月17日晚,中心纪委国家监委网站发布音讯,依据党中心关于巡视作业的一致布置,到4月16日,二十届中心第五轮巡视完结进驻作业。经党中心同意,二十届中心第五轮巡视将对河...
亲爱的读者们,你是否在忙碌的生活中渴望一点轻松的调剂呢?今天,我要带你走进一个充满欢笑和惊喜的世界——婉婉娱乐。这里,有数不尽的精彩节目,有让人捧腹大笑的喜剧,还有让人心潮澎湃的才艺展示。让我们一起揭...
你知道吗?在这个快节奏的时代,我们每个人都在寻找一种方式来放松自己,让生活变得更加丰富多彩。而文明娱乐,就是那个让我们的心灵得到滋养,让生活充满欢笑的神奇魔法。今天,就让我带你一起探索这个奇妙的世界,...
继续了三年多的俄乌抵触再次进入要害的奇妙时间。据央视新闻报道,俄罗斯总统新闻秘书佩斯科夫在5月13日的简报中标明,俄罗斯方面正在为方案于两天后举办的俄乌土耳其商洽做准备,普京在必要机遇将宣告代表俄方与...
据央视中文世界官方微信号4月18日音讯,伊朗对以色列建议报复性空袭之后,以色列将怎么作出“强有力回应”成为世界社会最重视的论题之一。内塔尼亚胡17日着重,以色列保有“自卫权力”。外界忧虑,伊朗核设备或...
日加希是什么字?汉字组合冷知识揭秘在汉字的海洋中,每一个字都有其独特的含义和故事。今天,CG吃瓜网的网友为我们科普了一个有趣的汉字组合——日加希。这个组合看似简单,却蕴含着深厚的文化内涵。日加希的构成...