拍客作品上传 APP

下载川观新闻客户端(苹果、安卓)

下载川观新闻客户端(鸿蒙)

建议使用浏览器扫码下载

微信

关注四川日报公众号

举报
中央网信办违法和不良信息举报中心 四川省互联网不良与违法信息举报中心
川观新闻 政声 热评 思想 问政 四川 天下 鸽子花 川观号
更多
<
文化 智库 生活 视觉 拍客 体育 旅游 第四极 专题 和美 巩固脱贫成果 制造强省 绵阳科技城 天府新青年 成都新区 成都治理 四川林草 德阳政企通 廉洁四川 四川交通 四川商务 巾帼四川 成都 自贡 攀枝花 泸州 德阳 绵阳 广元 遂宁 内江 乐山 南充 宜宾 广安 达州 巴中 雅安 眉山 资阳 阿坝 甘孜 凉山
>
>

扫码查看

全量免费的EMO模型上架通义APP,外媒称之为Sora之后最受期待的大模型之一

澎湃新闻 2024-04-26 18:19 发表于四川

澎湃新闻

2024-04-26 18:19

全文播报

发表于四川
该页面为预览地址,请勿公开转发。

澎湃新闻记者 胡含嫣

又一个国产大模型应用火出圈!

两个月前,阿里巴巴通义实验室公开了一篇能够让照片唱歌说话的生成式AI模型论文,EMO(Emote Portrait Alive),在海外媒体和社交平台引起热烈反响,被一批科技圈大V轮番转发。4月25日,EMO正式上线通义APP,开放给所有用户免费使用,应用上线瞬间通义APP一度被挤爆,有用户发现自己要排队数小时。其火热程度可见一斑。

EMO是通义实验室研发的AI模型,于今年2月底公开技术论文,被外媒称之为Sora之后最热门的AI模型之一,在开源社区Github上已经获得了超过6700颗星标。只需要一张人物肖像照片和一段任意时长的音频,EMO就可以让照片中的人物按照音频内容“张嘴”唱歌、说话,且口型基本保持一致,实现自然的面部表情和头部姿态。

短短两个月后,通义实验室已经将EMO产品化。所有用户都可以在通义APP中打开EMO产品页面,在涵盖各类歌曲、热梗和表情包的80多个首批上线模板中任选一个,上传一张肖像照,即可让照片、绘画、“纸片人”、数字人乃至雕像开口说话唱歌,并随时分享或下载保存所生成的视频。

富有表现力的AI视频生成框架

那么,EMO如何实现如此出色的生成效果?

据介绍,与目前市面上的主流视频生成算法不同,EMO的原理是用音频驱动图片的人像,使其做出与音频内容高度匹配的口型和表情。EMO的算法框架分为两步,用ReferenceNet引导去噪,用Backbone(主干网络)主干网络去噪。

在EMO之前,Talking Head领域的工作都需针对人脸、人头或者身体部分做建模或者表征,耗时长且生成质量较低。而EMO首次提出了弱控制的设计,剔除掉针对人脸的显示表征建模,转而采用一些相对较弱的控制条件来引导Diffusion去噪过程。

这就意味着,EMO降低了人物视频的生成门槛,且大幅提升了视频的生成质量,使得这一技术在视频制作、影视创作、电商直播等领域的规模化应用成为可能。

更惊人的是,通过在海量的人物讲话视频上进行训练,EMO模型不仅能够找到音频中具体发音与人像口型的匹配关系,还能发现音频中的语气特征与人物表情的关联性,从而将音频暗含的情绪色彩反映到了人物微表情上。可以说,EMO在训练中慢慢地学习了人类表达情绪的能力,并对其进行了编码。

不过,随着EMO的横空出世,一些人开始担心,EMO模型可能会成为某些别有用心者的犯罪工具。

为防止对口型技术被滥用,阿里云方面表示,通义实验室团队在应用内预置了经过审核的音频模板,暂不开放用户在EMO中自定义音频。用户只可上传照片,且需严格遵守平台协议,使用符合规范的照片来生成视频。其次,平台会对用户生成内容进行算法和人工两道审核,确保内容安全。用户上传的照片仅用于AIGC生成,平台会严格保护用户的信息安全。

同样是出于安全方面的考量,目前,EMO暂不开放API,团队将对安全策略进行充分论证后再进行下一步工作。通义实验室也欢迎社会各界群策群力,提供更好的安全建议,以便在安全可控的前提下推动大模型技术和应用的发展。

阿里:做全民可用的大模型应用

从2022年ChatGPT的诞生,到国内的百模大战,AI大模型热潮已经持续超过一年。如今,大模型已经逐渐走进千行百业,甚至成为全民可用的应用。

今年2月,随着OpenAI放出文生视频模型Sora的展示片段,由于其高水平的演示质量和超出一分钟的生成视频时长,立刻引爆了AI视频行业。在Sora之前,已经出现了Runway、Pika、Stable Video等热门文生视频模型。

不过,Sora直到今天都没有定下面向公众开放的日期,而已经开放的Runway和Pika等模型大多需要按使用次数计费、价格不菲,抑或是需要专业的开发者知识去使用,生成视频时长也不超过16秒。

虽然通义APP上的EMO模型目前只支持有限的模板,但其已经成为全民免费可用的AI视频模型,上手简单、使用方便,还自带供用户进行分享的生态社区。另外,APP上提供的模板中包含了大量网络热梗,有利于所生成短视频的传播和分享,并展现出该模型未来和更多影视IP合作的潜力。

当下,全球AI大模型行业依然进展飞速,各大科技巨头都在积极地卷模型、卷应用。面对迭代速度越快、种类越来越丰富的大模型,时常会让用户产生一种不知从何处下手的感觉。不过,说到底,这些AI模型都是将人类思想与创意具现化的工具,而通义APP有望正在演变成一个包罗万象的工具铺,成为每位用户手中一个随叫随到的超级AI助手。

在大模型的C端入口上,阿里无疑是最激进、步伐最快的科技公司。自今年年初以来,通义APP已经上线了现象级应用“全民舞王”、超长文档解析、AI编码助手、AI会议助手等众多免费功能,成为国内功能最丰富的大模型应用。

【未经授权,严禁转载!联系电话028-86968276】

投票

打开川观新闻,阅读全文

未经授权,严禁转载!

如需转载,请私信小编,或致电:028-86968693 028-86968276

转载须在正文开头显著位置注明稿件来源及作者,违者必究

川观新闻官方网址:https://cbgc.scol.com.cn

扫描或长按关注川观新闻微信号(微信号:cbgc2014)

川观新闻二维码

精彩评论 0

查看更多评论
我要评论

去APP中热议吧

去APP查看

去APP查看全文

相关新闻
  • 中银证券回应APP下架

  • 冲刺“大模型第一股”!MiniMax、智谱通过港交所聆讯,公司回应

  • 日本一幼儿园误将食品模型塑料用于装饰蛋糕,并分发给133名儿童食用,目前已有3名儿童出现腹痛症状

热新闻
天 周 月
1
“成都女子家门口遇害案”一审宣判 专家解析焦点问题
2
国内第一所“飞行大学”要来了!我国80%的民航机长从这里起航

30:01

3
《新闻联播》回放(2025·12·20)
4
于会文任呼和浩特市委书记
5
两轮冷空气接连“营业” 中东部气温波动大温差将超10℃
6
我国成功发射通信技术试验卫星二十三号
7
官方通报“南极磷虾油”事件:已成立联合调查组
8
去韩国看演唱会?小心诈骗分子,驻韩使馆发布提醒
9
身体有这3种信号,可能是脑梗!千万别大意

02:35

10
C视频·节令AI短剧|冬至时节和“滚滚”一起逛成都
1
喇叭河踏雪听风,泸沽湖鎏金入画,这个周末邂逅四川冬日浪漫丨川观号加新时刻 12.19
2
邂逅冬日里的四川秘境,看各地雪景裹上银装素裹的温柔丨川观号聚焦时刻(12.11- 12.18)
3
何晴离世,为何引发年轻人的集体怀念?丨新闻两点论

39:58

4
1218,风至帆满!
5
攀枝花推动医疗资源“下沉”到家门口:基层“接得住” 百姓“愿意去”丨市州观察
6
3105万!杭州有人中得双色球大奖
7
尾盘惨烈杀跌,平潭发展、东百集团瞬间“一字断魂刀”,发生了什么?丨川观解盘
8
四川盆地首个致密油田诞生

04:29

9
王晓晖主持召开2025年省委议军会议和省委理论学习中心组专题学习(扩大)会强调:持续推进我省国防动员和后备力量建设,努力开创国防建设和经济社会协调发展新局面

03:01

10
年度热搜里的TA⑦丨当傈僳族服饰登上时装周,谷艳用一场“十年蓄谋”重返巴黎
1
喇叭河踏雪听风,泸沽湖鎏金入画,这个周末邂逅四川冬日浪漫丨川观号加新时刻 12.19
2
邂逅冬日里的四川秘境,看各地雪景裹上银装素裹的温柔丨川观号聚焦时刻(12.11- 12.18)
3
乘势而上 开启奋进“十五五”的序章——写在省委十二届八次全会召开之际
4
超80吨!四川最大金矿来了

19:01

5
受权发布丨中共四川省委十二届八次全会公报
6
“男子请陪产假8分钟后被开除”,公司:想借陪产不劳而获纯属算计……法院判了!
7
搭乘一列车,与全世界做生意——从第12万列中欧班列看四川向西开放丨牢记嘱托 奋力打造两高地两基地一屏障
8
何晴离世,为何引发年轻人的集体怀念?丨新闻两点论
9
川言丨“十五五”,寻找四川高质量发展确定性
10
四川省成都市委副书记、市长王凤朝接受审查调查

精彩评论

小观推荐

0

关注我们

关于我们 | 广告业务 | 联系我们
四川日报社版权所有  未经书面授权 不得复制或建立镜像
Copyright ©2011-2019 SICHUAN DAILY All rights reserved.
四川日报报业集团 四川日报网  蜀ICP备12028253号-2  
互联网新闻信息服务许可证:51120170001
川观新闻跟帖评论自律管理承诺书

温馨提示

打开川观新闻客户端听全文

关闭

打开

温馨提示

是否在川观新闻客户端中打开这篇文章

取消

打开

温馨提示

还想查看更多评论请在客户端中查看

取消

打开