Soul创始人张璐团队推出多模态社交应用,促进社交体验创新迭代
原标题:Soul创始人张璐团队推出多模态社交应用,促进社交体验创新迭代
在AI大模型全面发展的当下,多模态模型是当前训练和开发的重要方向,在社交行业实践中显现出极强的可交互性,能够提升应用的可用性,带来更丰富的社交体验。新型社交平台Soul App创始人张璐团队正积极迭代升级多模态能力,致力打造社交“多边形战士”。
Soul的“AI+社交”布局正朝着多模态方向不断升级,而促进虚拟人在文字、语音、图片等方面模态的相互结合是Soul的主攻方向。在Soul 创始人张璐看来,产品有一个文字对话的基础得分,做得很好就可以得到六七十分。如果基础得分不好,即使声音做得再好,图片理解方面再出色也不行。确定拿到基础得分后,接下来就是不断迭代,做好多模态争取更好的表现。为此,夯实文字对话基础是Soul虚拟人升级的第一步。
Soul的各类AI功能升级离不开自研大模型SoulX的助力。SoulX具备了prompt驱动、条件可控生成、上下文理解、多模态理解等能力。这一多模态能力不仅提升了虚拟人在帖子、图片、音频等多种形式创作上的能力,也还让Soul的一众社交场景产生了更多高质量的内容。
与此同时,在夯实文字对话能力后,Soul也在持续优化语音系统。语音模态是Soul比较看重的一大功能。Soul创始人张璐表示:“语音是一个相对重要的点,可能会占30分。语音其实有很多人在做的,有非常多的解决方案,我们会聚焦在AI语音赋能‘温度’和‘陪伴感’方向,因为社交互动本质上是情感的流动”。这个多边形战士不仅需要具备多模态的能力,还需要情感化,而不只是提升效率的工具。虚拟人需要找到用户的情绪价值点,同时具备个性化,展现出不同的性格特征;有时候应该顺应用户,有时候应该拒绝用户。
目前,Soul表现较好的虚拟人有AI苟蛋。AI苟蛋是一个多模态的机器人,有非常明显的拟人倾向。比如,用户分享一个照片,它能够根据对照片上的内容和时间理解,判断发生什么事情,然后进行主动地关怀和互动。还能基于和用户的历史聊天内容,沉淀回忆、构建个人专属记忆的虚拟伙伴。从Soul公开的数据看,AI苟蛋的对话轮数比较高,用户平均每天会给苟蛋发送超过70条消息,互动平均时长超过30分钟。这其实已经意味着,很多用户把苟蛋当做了可以持续互动聊天的伙伴。
从大模型的发展趋势看,多模态是发展的必经之路,AIGC大模型从单模态向多模态发展已成为行业共识。Soul创始人张璐团队不断更新多模态社交应用、促进社交体验好上加好,体现了Soul 追求卓越、臻于至善的发展态度,也体现了Soul对用户体验提升与对社交行业发展的创新能力。