人工智能大势-第226期
一、深入探讨大模型幻觉问题
前段时间写了篇文章,《大模型的“幻觉”究竟有什么意义?》,起因是原OpenAI科学家Andrej Karpathy就发表观点说:从某种意义上说,大语言模型的全部工作恰恰就是制造幻觉,大模型就是「造梦机」。
Karpathy这话的意思似乎是说人工智能大模型的幻觉不是啥大问题,之后不久又看到了类似说法,被称为人工智能教父、神经网络之父的Geoffrey Hinton(辛顿)教授在牛津大学做的一个公开演讲中说:
5、大模型的幻觉不是问题,人也会胡说
心理学家从来不说大模型有幻觉,因为心理学家知道人类也经常编造东西。
任何研究过记忆的人都知道,对人类而言,真实记忆与虚假记忆之间并没有明确的界限。
Hinton说,“如果某件事是最近发生的,并且它与你理解的事情相符,你可能会大致正确地记住它。如果某件事是很久以前发生的,或者是比较奇怪的事,你会记得不正确,而且你经常会非常自信地认为你记得正确,但你错了。”
看了这段话,笔者的第一感觉就是”人确实会胡说“,辛顿这话就是例子,又或者辛顿确实老了(快80岁了),开始出现幻觉了。
大模型幻觉真的不是问题吗?前不久发生了这样一件事,《Midjourney尴尬亮相学术界:为生物学论文配图,错得好离谱!围观网友嘲讽拉满》,文章说:
有人用Midjourney给生物学论文配图,画得漏洞百出,结果还一路顺畅成功发表???
……
更令人费解的是,接收并发表该篇论文的期刊,是生物学SCI期刊 Frontiers in Cell and Developmental Biology(《细胞与发育生物学前沿》),影响因子在5.5左右。
看见没有,稍微复杂点的幻觉,连专业人士都可能没有注意到,因为这类刊物发表论文肯定是有专业人员审稿的。这样的错误论文一旦发出来,肯定会给相关领域的学术研究带来危害,好在这次很快被人发现,论文也被及时撤稿了,不过给该期刊肯定是造成了难以挽回的负面影响。
由于辛顿等人的权威地位,以及笔者上一篇文章主要探讨了幻觉有利的一面,即能够给我们带来意想不到的创意,对其有害的一面着墨不多,因此有必要再次对大模型幻觉问题进行进一步的深入探讨,以避免“大模型幻觉没有问题”之类的误导。
大模型的幻觉实际上分为两类:
第一类:三岁小孩也能看出来的、明显的低级错误,比如中午死了的人晚上还活着,或者图片中的人有6个手指等等;
第二类:事实性错误,比如把某个名人的出生日期或成就搞错等等。
很显然,辛顿只说了第二类幻觉,而更加常见的第一类幻觉却被他忽略了。
是的,人确实会犯第二类幻觉这种错误,记错曾经发生过的事,但人们在正常情况下是不会犯第一类幻觉的错误,除非他喝多了。
人喝多了是真会产生幻觉,前两天笔者与一帮战友一起吃饭,好几个战友都喝多了,另外天气比较热再加上酒劲,大家都把外套脱了,走的时候一个喝多的战友非说他的衣服不是他的,笔者送他上了出租车,车刚开他就把衣服从车窗里扔了出来,笔者只好帮他捡起来先收着,等下次聚会时再还给他。
笔者一直不太喜欢使用”幻觉“这个词,而代之以”低级错误“,可是战友喝多这事让笔者感觉使用幻觉一词还是挺恰当。另外,把记错事实说成是幻觉也没啥毛病。业界既然已经成为了惯例,我们也就”入乡随俗“,统称为幻觉吧。
但笔者还是觉得这两者如果能在名称上有所区分更好些,可以避免像辛顿那种忽略其中一类幻觉的问题。这两种错误确实存在着本质的不同:
第一类的低级错误,实际上是常识性错误或逻辑错误,也就是杨立昆(Yann LeCun)喜欢说的世界模型错误。
第二类事实性错误,即与事实不符,虽然也是错误,但并不一定违背常识、逻辑或世界模型。
下面用一个例子来更清楚地说明这一区别:
你昨天中午吃了两个包子,今天跟别人说昨天中午吃了100个包子,这就是逻辑错误,是不符合常识的,现实世界人类的肚子装不下100个包子,所以也是不符合世界模型的。同时别人马上就能知道你这是错的,因此也称为低级错误。这种错误当然也是不符合事实的,即同时是事实性错误。
你昨天中午吃了两个包子,但你记错了,跟别人说昨天中午吃了三个,这就是事实性错误。但是一个人吃三个包子仍然是符合逻辑、常识和世界模型的,因此不属于逻辑性错误,并且这种错误很难一眼看出来。
正因为有这样本质上的区别,虽然都称为幻觉,但笔者建议将第一类错误称为”逻辑幻觉“,第二类错误称为”事实幻觉“。
之所以要费那么大劲来说这事,就是因为这对于大模型幻觉问题的解决应该是很有意义的,由于这两类幻觉本质上的不同,也许需要采用不同方法来解决。那种认为幻觉不是问题或者不需要解决的观点,你就当他是胡说或幻觉吧。
与辛顿同为深度学习三巨头之一的杨立昆特别推崇为人工智能建立世界模型,他认为一旦建立了世界模型,大模型的幻觉问题便解决了。但是从上面的分析可以看出,世界模型只能解决逻辑幻觉,而对于事实幻觉是无法解决的,因为事实幻觉一般是符合世界模型的。
业界还有一种看法,常识、逻辑幻觉不是大问题,就因为它们一眼就能被人们看出来,所以并不可怕,而事实幻觉,尤其是比较复杂的,因为难以发现而持续存在,因此可能带来很大困扰,甚至是危害,也就是说事实幻觉带来的问题更严重。
然而即便事实幻觉损害更大、更可怕,逻辑性幻觉也是必须要解决的问题,比如说我们让大模型写文章,你总不会希望它写出来的文章满篇都是低级错误吧,虽然你能很容易检查出这些错误并改正之。而绘画还不一样,如果它给人画了6根手指,你都很难修改,只能弃用并重新生成,笔者常常就因此为了一幅图要重新生成几十次,甚至最终也无法生成正确的图片。
上面说这两类幻觉有着本质不同,是从我们人类的角度来说的,人类解决这两类幻觉的方法也是完全不同的。小孩子一般会有逻辑幻觉,这源于他们对事物的不了解,比如会去摸火,这种问题就要靠多学习和在自然界中实践来解决;老年人则常会有事实幻觉,也就是忘记或记错之前的事情,这只能从改善记忆力方面去解决。
然而对于大模型来说是否也是如此呢?从深度学习的原理来看,这两类幻觉都是由于统计数据不足所造成的,而且计算机应该不会有人那种忘记或记错,除非是灾难性遗忘,那是另一个问题。也就是说从底层来看两种幻觉是同一个问题,或许能够找到一个方法同时解决或极大缓解这两种幻觉。不过,杨立昆的世界模型方法恐怕是不行的,因为只能解决逻辑幻觉。
二、资讯
1、刚刚!奥特曼放出来了GPT-5的内容:能力提升幅度超乎想象
奥特曼爆料啦!他透露说,GPT-5这个大家伙,能力简直要逆天了,比我们现在想象的还要强大不知道多少倍。就像是从GPT-3一下子跳到GPT-4那样的大跨步,让人瞠目结舌。
奥特曼还霸气回应了那些说GPT模型有局限的人,他表示只要给足计算资源,我们就能造出个超越人类智能的通用人工智能(AGI),完全不在话下!
现在,奥特曼和OpenAI的小伙伴们全神贯注地搞这个AGI,其他的事儿他们都不怎么关心了。他们还想方设法地推动全球AI基础设施的创新,想要解决能源短缺等一大堆问题。
不过啊,奥特曼也提到了个让人头疼的问题,那就是数据量增长可能会跟不上AI的发展速度。这可咋整啊?看来我们得想办法让模型用更少的数据就能学到更多东西才行。
哎呀,说起来,之前奥特曼就跟比尔盖茨聊过GPT-5这个神秘家伙。他当时就说,这个模型会有更棒的推理能力、更高的准确性,还能支持视频呢!这简直就是让人工智能变得更像人一样,能听能看还能说!
总之啊,GPT-5这个大家伙一旦出来,肯定会掀起一场AI革命的风暴!让我们一起拭目以待吧!
2、老黄炸场!深夜发布全球最强芯片B200!推理速度提升30倍
在这次的AI春晚GTC大会上,老黄可没闲着,他直接扔了个大炸弹——全球最强芯片B200!这家伙的推理速度简直快到飞起,直接飙升了30倍!不仅如此,英伟达还揭开了新一代Blackwell架构的神秘面纱,要把AI能力扩大到万亿参数级别,真是牛到不行!
这大会啊,简直就是个技术大杂烩,各种新技术层出不穷。除了B200这个GPU核弹,还有超级芯片GB200、Blackwell新服务器等等,看得人眼花缭乱。哦对了,还有个AI推理微服务NIM,听起来就像是给AI找了个小助手一样。
老黄还特地提到了新光刻技术cuLitho进驻台积电,这就像是给芯片制造商送上了一把瑞士军刀,啥都能干!他还强调了加速计算的重要性,说通用计算已经过时了,得找新办法来降成本提效能。
最让人震撼的是,英伟达用B200 GPU和Grace CPU组合出了GB200超级芯片,然后又搞出了包含18个计算节点的新一代计算单元GB200 NVL72。每个计算节点都有两个超级芯片,整个机柜在FP8精度下的训练算力居然高达720PFlops!这简直就像是搭建了一个超级强大的AI军队,准备征战四方!
总之啊,这次GTC大会真是让人大开眼界,老黄和英伟达又给大家带来了不少惊喜。看来AI这个领域,真的是越来越有看头了!
3、突发!Stable Diffusion核心团队被曝集体离职
惊爆!Stable Diffusion核心团队竟然集体跑路了!
Stable Diffusion那个超厉害的研究团队居然集体辞职了!这包括他们的老大Robin Rombach,还有另外两个猛将Andreas Blattmann和Dominik Lorenz。他们到底为啥要走啊?目前还没人知道确切的原因,不过听说《福布斯》爆料说,Stability AI这家公司现在都快穷得叮当响了,连新资金都融不到,这可真是让人捏把汗啊!
话说回来,Stable Diffusion这个项目最开始可是个学术研究的小火苗,后来被Stability AI这个大金主给捧红了,一下子就火遍了整个圈子。可惜啊,Stability AI这公司虽然有钱,但不知道怎么挣钱,每个月都得花大笔的钱来维持运营,这可真是让人捉急啊!
结果呢,就在上个月,Stable Diffusion 3这个升级版还刚刚发布,让大家眼前一亮。可是这才过了一个月,团队就传出这样的消息,真是让人大跌眼镜啊!
网友们现在最担心的问题是:这个还没全面开放的Stable Diffusion 3,还能继续开源让我们玩嘛?唉,希望这个团队虽然走了,但他们的项目还能继续发光发热啊!
4、UC伯克利「LLM排位赛」结果出炉!Claude 3追平GPT-4并列第一
UC伯克利搞了个「LLM排位赛」,结果你猜怎么着?Claude 3和GPT-4打了个平手,并列第一!自从Claude 3这个小鲜肉出道以来,Anthropic就一直嚷嚷着说它比GPT-4还牛,各种测试集上也是稳稳地压着GPT-4一头。不过啊,这排行榜可是有点偏心眼的,喜欢给先出道的模型加分。所以Claude 3这个后起之秀能跟GPT-4这个老江湖平起平坐,已经是很了不起了!
而且啊,Claude 3可真不是吃素的,它在数学方面可是比GPT-4还厉害呢!就像是个算术小能手,加减乘除样样精通。尤其是那些让人头疼的9-10位数加减法和5位数乘法,Claude 3做起来就像吃饭喝水一样轻松。看来啊,这次「LLM排位赛」可真是精彩纷呈,让人大开眼界啊!
5、Kimi连续宕机打醒巨头!阿里百度360连夜出手长文本,大模型商业化厮杀开始了
Kimi这哥们儿火得一塌糊涂,服务器都扛不住了,直接宕机!在3月18日宣布上下文窗口技术突破至200万字之后,系统流量的激增超出了公司预期,引发了技术故障。
这可把阿里、百度和360这些巨头给刺激到了,连夜开始拼长文本能力。Kimi这个大模型真是个宝藏啊,支持超长文本还能免费玩,一下子就把大家给迷住了。现在大家都想分一杯羹,百度文心一言、360智脑、阿里通义千问都忙着升级自己的长文本能力,一个比一个能装。
这波竞争可不是闹着玩的,这可是大模型商业化争夺战的序幕!各大厂商都忙着找商业化落地场景,想赶紧把钱给赚回来。Kimi的爆火也许就是个转折点,以后国内大模型市场的竞争,可能得看产品体验和对客户需求的了解程度了。
简单来说,就是大家都看到了Kimi这个大宝贝,都想抢过来玩玩,结果就搞出了这么一场疯狂的长文本能力大比拼。接下来,咱们就看看谁能笑到最后,把这场商业争夺战给打赢了!
三、研发
1、Nature重磅:AI击败最先进全球洪水预警系统,提前7天预测河流洪水,每年挽救数千人生命
洪水这个家伙可真是捣蛋鬼,全球有15亿人得提心吊胆地过日子,生怕被它搞得家破人亡,经济损失也是一笔不小的数目呢!现在的洪水预警系统啊,太依赖沿河的观测站了,可这些站点分布得乱七八糟,很多地方的洪水预警都成了大问题,特别是那些发展中国家的小伙伴们,真是苦不堪言啊!
不过好消息来啦!Google Research团队最近搞出了一个超酷的AI模型,用5680个测量仪来训练,竟然能预测那些没被测过的流域接下来7天内的日径流情况,简直跟开了挂一样!而且呢,他们把这个AI模型和全球最牛的洪水预警系统GloFAS进行了PK,结果你猜怎么着?AI模型赢啦!准确性一点儿也不比GloFAS差,甚至有时候还更高呢!
那么这个AI模型是怎么做到的呢?其实啊,它就像个大脑一样,从一堆气象数据中学习并预测河流的流量。想象一下,它就像个超级学霸,能够从海量的信息里找到规律,然后告诉我们接下来会发生什么。这简直太神奇了!
这个研究成果已经登上了权威的科学期刊Nature,研究团队高兴得不得了,他们说这个AI模型能提前7天预警小规模和极端的洪水事件,让发展中地区的小伙伴们也能得到靠谱的洪水预报,这样一来,每年就能挽救成千上万人的生命呢!简直是个洪水小英雄啊!
2、AI足球教练上岗利物浦,射门机会提高13%!来自DeepMind,网友:这不公平
谷歌的DeepMind团队跟利物浦队联手搞了个AI足球教练,这教练真牛啊,竟然能让球队的射门机会提高13%!这AI教练设计战术,厉害得让人分不清是真人还是机器干的,连那些专业的足球专家都有90%的时候被它的建议给迷倒了。
也有人觉得DeepMind选利物浦当合作对象有点私心,觉得他们是不是想用AI黑科技给自己喜欢的球队加把劲。不过啊,讲道理的话,阿森纳离DeepMind总部更近呢,怎么就没选他们呢?哈哈!
这个AI教练最厉害的地方就是搞定角球战术。你知道角球是进攻的大好时机吗?据统计,30%的进球都是来自角球呢!DeepMind团队把这个机制给玩透了,他们的AI能预测角球传中后,哪个球员最有可能接到球,准确率高达78.2%,比那些专家还准呢!
而且,这AI教练不仅能帮你选对传球的人,还能分析角球战术的效果,告诉你应该怎么调整策略才能增加射门机会。最后,用了这AI教练的建议,进攻方的射门概率直接从18%涨到了31%,防守方也被搞得没辙,射门概率从75%降到了69%。这谁看了都得心动吧!
至于这AI教练是怎么搞出来的,他们用了图神经网络、几何深度学习等一堆高科技。现在大家最关心的问题就是,这AI教练在比赛时能不能实时分析、给出建议呢?还有,如果AI真的普及了,足球比赛的观赏性会不会受到影响呢?
谷歌最近搞了个超酷的“VLOGGER”视频框架,简直就像魔法一样!只需要一张你的照片和一段你说话的录音,它就能帮你生成一个超级逼真的演讲视频,最长能有10秒哦!
它有一个人体到3D运动的扩散模型,还有一个增强文本到图像的新扩散架构。这些模型就像是一群魔术师,把音频波形变成你的动作,然后再把这些动作变成视频帧。
而且,这个VLOGGER可是在一个超级大的数据集上训练出来的,里面包含了好多好多的人物视频。所以,它生成的视频特别多样化,完全符合你的人物形象。
跟其他类似的方法比起来,VLOGGER简直就是个全能选手!它不仅能控制你的面部表情,还能控制你的肢体动作,让你的视频看起来更加逼真。
最有趣的是,这个VLOGGER还能帮你编辑视频呢!比如,你可以一键让你的人物闭嘴、闭眼,或者只闭左眼,全程睁眼也没问题。还能把原视频的英语讲话改成口型一致的西班牙语,简直就像是有个私人视频编辑师在你身边一样!
当然啦,也有网友吐槽说,画质有时候有点感人,口型有时候会抽风对不上,看起来还是有点像机器人。
4、CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
你有没有想过有一天我们的电脑能像超人一样,轻松搞定图片和视频里的所有目标感知任务?告诉你,这不再是遥不可及的梦想啦!在CVPR 2024这个科技盛会上,华中科技大学和字节跳动的研究团队就推出了一位“超级英雄”——GLEE目标感知基础模型!
这位“英雄”可不得了,它不仅能听懂你的指令,还能根据开放词表、目标的外观位置描述,甚至你的手势、涂鸦等各种互动方式,帮你搞定各种复杂的任务。比如说,你想找出图片里的某个特定目标,或者把视频里的某个目标分割出来,甚至想跟模型互动一下,让它帮你完成一些高难度的操作,GLEE都能一一帮你实现!
而且呢,这位“英雄”还是个学霸!它可是从超过一千万的多源数据中汲取了知识,学会了如何适应新的数据和任务,哪怕你之前从没教过它怎么做,它也能自己摸索出答案来。
这位“英雄”还是个无私的分享者,它的模型和训练代码都已经全部开源了!
5、Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放
Stability AI家族又添了个新丁,名叫「Stable Video 3D」!这家伙可是个3D视频生成的大咖!他呀,是基于Stable Video Diffusion打造出来的,能帮你把3D生成的质量和多视角一致性提升得杠杠的!
想商用的话,你加入Stability AI会员就行;想玩玩看,去Hugging Face下个模型权重就搞定了。最牛的是,Stable Video 3D还有俩“分身”,一个叫SV3D_u,另一个叫SV3D_p,他们俩各自擅长不同的场景哦!
这个Stable Video 3D,简直就是3D生成领域的明星!他特别擅长搞新颖视图生成,不管你从哪个角度看,他都能给你整出连贯的视图,简直厉害得不行!最重要的是,他还能让多个视图里的对象看起来一模一样,这可真是前所未有啊!
想了解更多关于这个大咖的故事吗?嘿嘿,他的研究论文已经出炉了,三位大神联手打造!
6、音乐ChatGPT时刻来临!Suno V3秒生爆款歌曲,12人团队创现象级AI
音乐界的ChatGPT时代真的来啦!Suno AI这个神秘又酷炫的AI公司,推出了一款让人惊艳的音乐生成模型V3!别看它只是个小小的模型,但它却能在短短几秒内,就像变魔术一样,创作出整整2分钟的炫酷歌曲!而且,它还能驾驭各种风格,古典、爵士、Hiphop、电子,全都不在话下!
更令人激动的是,这个神奇的音乐生成器现在竟然对所有人免费开放!网友们简直像疯了一样,纷纷上线尝试创作,想听AI写的歌都成了一种新潮流!有人说,听完Suno V3生成的歌曲,简直颅内高潮,爽到不行!
排行榜上的热门歌曲也被AI歌曲霸屏了,像那首“水调歌头·明月几时有”,古典韵味十足,听得人如痴如醉。还有现代感十足的“著了魔”,听完真的有种恋爱的感觉!网友们纷纷表示,以后只听AI写的歌就够了!
Suno官方还透露,他们正在开发更强大的V4版本,准备带来更多让人眼前一亮的新功能。看来,AI真的要攻陷音乐界了!
7、升级!Sora漫步街头的女人可以跳舞啦!科目三蹦迪多种舞姿停不下来,可精准控制动作
Viggle在推特上迅速走红!可以让图片中的人物跳各种舞蹈,让角色们停不下舞步!
Viggle这个鬼才简直就像是个动作指挥家!想象一下,你只要轻轻一句指令,角色们就能跳出空中芭蕾,还流畅得跟专业舞者似的!
Viggle厉害就厉害在它不仅有JST-1技术加持,还像是个物理学小达人。无论多炫酷的动作,它都能让角色们按照现实物理规律来跳,完全不会让人出戏!
而且啊,Viggle还提供了五种花式玩法,让你玩得嗨翻天!无论是想让超级英雄跳科目三,还是想让静态角色活灵活现,它都能帮你实现!
当然啦,就算Viggle再厉害,也有它的小烦恼,比如有时候它会分不清裙子和裤子,这点小瑕疵倒也不影响它成为创意释放的大神器!
四、自动驾驶
1、美国自动驾驶巨头 Cruise 华裔前员工加盟小鹏汽车,担任 AI 团队负责人
Cruise公司的华裔机器学习大神Liu Xianming,跳槽到了小鹏汽车,摇身一变成了AI团队的掌门人!这位感知系统的专家,之前在Cruise可是高级资深机器学习工程师。
说起来,这位大神在Cruise干得好好的,突然就在今年2月宣布离职,结束了近四年的工作。然后呢,他就在个人页面上高调宣布加盟小鹏AI团队,还顺便发了个招人邀请。
不过话说回来,Cruise公司最近也是风波不断。去年底,联合创始人兼CEO Kyle Vogt和首席产品官Daniel Kan相继离职,让公司陷入了人事动荡。而今年3月,内部邮件又曝光了期权股价暴跌51.4%的噩耗,估值也跌得惨不忍睹。看来,这位大神的跳槽,也是时候把握机会,追求更好的发展啦!
小鹏汽车计划在未来3年推出超过10款全新车型,看来,小鹏汽车是要在自动驾驶领域大干一场了。
五、竞赛
1、总奖金 4 万美元!亚马逊 KDD Cup 2024 大模型在线购物竞赛正式启动
听说了吗?亚马逊搞了个大动作!他们刚刚宣布了KDD Cup 2024大模型在线购物竞赛,就在3月18日火热开启,而且总奖金高达4万美元哦!
竞赛要求参赛者把通用知识LLM这个大语言模型,变成在线购物领域的超级助手。要能理解购物中的各种实体,还要解决对应的实际问题,比如产品、属性、评论、商品推荐等等。
这个竞赛还是ACM知识发现与数据挖掘国际会议(KDD)的竞赛项目之一,那可是个大咖云集的地方。通过这个竞赛,你不仅能拿到丰厚的奖金,还能和学术界、工业界的大佬们交流学习,拓展你的视野和人脉。
六、投资
1、爱智运AI-Truck新能源无人驾驶矿车优质项目融资
porA轮,融资金额:2500万元,出让股权10%,产业资本或者引导基金优先。
新能源无人驾驶矿车项目,国内拥有新能源及无人驾驶乘用车整车开发设计团队。目前产品场景测试完毕,拥有采购订单在手超1亿元。
急需要补充现金流扩展交付及团队建设。
联系人:张连才,18676259990
玖智科技(苏州)有限公司成立于2022年3月,专注于宽体矿车新能源与无人驾驶智能技术研发及整装车辆产品和服务输出,实现在露天采矿、散货码头运输场景下批量的环保型智能运输系统。
其团队曾参与了国内外大量乘用车新能源和无人驾驶项目,是最早投入新能源和无人驾驶技术的团队之一,曾参与领导多家大型互联网公司、车企的新能源及无人驾驶项目,也是中国最早投入露天矿无人驾驶生产运行的团队。
“爱智运”是玖智科技的无人驾驶矿卡自有品牌,是玖智科技推出的“车-场-云”架构的矿山无人运输解决方案,是基于感知、规控、协同、云控、大数据、电控、甲醇增程电驱、能量回收、梯次动力等技术融合,实现了采场、堆场作业无人化、低功耗、零碳,成为安全矿山、智慧矿山、绿色矿山建设的新技术路径。
“爱智运”无人驾驶矿卡及无人运输解决方案已经在内蒙古、甘肃、山东、新疆等多地的砂石矿、露天煤矿进行了试点,获得了业界高度评价,成为了矿山建设运营的新标杆。
七、视频
1、Domo AI 也上线了让静态人像动起来的功能,只需要你的一张照片和一个参考的动态视频,那么就能把动态视频中的人物替换成静态照片里的人物。
https://weibo.com/1627825392/O6xi03btz
2、美国斯坦福大学重磅发布家务机器人,能做饭、能浇花、能干各种家务。
https://weibo.com/7276811751/O5StnyVcS
– END –
感谢百度文心一言大模型生成文章摘要!
感谢阿里通义万相大模型生成封面图片!
我的书《人工智能启示录》经过两年的不断反复审核、修改,终因观点太过尖锐、内容太过敏感,且我不愿过于妥协,因而过不了出版社方面的最终审核,现放到网上供大家免费阅读,其中有很多内容是从未在网上发表过的。阅读请点链接:https://note.youdao.com/s/RsCmSfCX
人工智能或能破解中国动画片的困境 | 有了人工智能,我们就可以躺平吗? | 人工智能真的不一样 | Sora来了,狼又来了?| 人脑到底是不是在做预测? | OpenAI科学家只有小学语文水平? | 人工智能通过学习获得自我意识 | 国产大模型确实还有不小差距 | 大模型的“幻觉”究竟有什么意义? | 2023年终总结 | 2022年终总结 | 2021年终总结 | 2020年终总结 | 2019年终总结 | 更多文章
点评 | 《达沃斯聚焦人工智能 以“善治”促“善智”成共同呼声》