深度|扎克伯格最新万字洞察:信息流媒体将更多转向个人及 AI 互动,未来看好这三类 AI 硬件类型
2024-07-01 20:08:51
  • 0
  • 0
  • 0

来源:有新Newin AIGC新智界

在与 AI 互动的那一点,这是我们的核心设计原则之一。

我们不想让人们以为他们在与创作者本人互动。我们希望它尽可能高保真地反映创作者的意图,但也会非常清楚地标明这是 AI ,这样就不会有任何混淆。

当你与社区互动时,你可能会觉得可以在表达上更加自由或冒险,或者在某些可能更具风险的表达上更加接近底线,但你可能不希望你的 AI 这样做。

尽管你可以让它基于你的社交媒体内容进行训练,但你可能希望训练它在某些事情上保持更加谨慎,避免涉及某些话题,直到你对它能够准确地反映你的意图有更多的信心。

这些工具非常重要,但这是一种艺术形式,我们在开始时并不知道什么是最具吸引力、最能建立信任的公式。因此,我们希望提供工具,让大家可以试验,看看什么最终效果最好。

Robin Kallaway

我真的很想讨论的是 AI 工作室的未来功能创意。让我给你一个非常酷的例子。当你在观看这个视频片段时,如果有人可以点击你的衬衫或我的帽子或这个灯,并立即有一个 AI 层识别品牌和产品,自动添加到购物车,并自动跟踪返利。这种无形的层次可以真正帮助实现货币化。

显然,由于基础设施原因,每小时有数百万个Reels被创建,今天支持这一点会很困难,但这可能在计划中。还有哪些未来的 AI 工作室功能是我们还没讨论到的,你认为我们在未来三到五年内可以实现的?

Mark Zuckerberg

理解不同物品的功能应该随着时间的推移适用于所有帖子。我们会达到那一点。我们在Ray-Ban Meta 眼镜上有这种多模型 AI 的早期版本,你可以说,“嘿 Meta ,看一下这个东西是什么?”它非常准确地告诉你我们在看什么,并能够回答相关问题。

随着 Llama 模型的不断改进以及我们完全推出下一版本,这只会变得更好,这是一个大功能。还有很多类似的事情,能够自动翻译和配音是我对未来非常感兴趣的事情。

讲英语的人常常忽视了世界上很多人不讲英语。能够自动将所有内容翻译成各种语言,并使其对更多人可访问,如果能感觉到真实并像你在说那种语言一样,那将非常强大。

这些是一些非常令人兴奋的想法,但这些不同于 AI 工作室,这是 AI 在内容、内容理解和内容翻译等方面的不同应用。

对于 AI 工作室本身,将会是如何给创作者提供更多工具来调整体验,使其更加有趣和建立信任的一种持续演进。我们还会添加不同的模式。

起初是文本,但随着时间的推移,会有视频、音频,最终能让它成为3D,这样你就可以以全息图的形式出现在某人的客厅里,这将非常酷。我们专注于元宇宙和所有具象化工作,这也是我们的自然路径,我们试图让创作者能够以更自然的方式与人们互动。

Robin Kallaway

我非常喜欢你提到的这个 Agent 网络的概念,因为我在玩这个的时候,我在想,好吧,这是一级,那二级会是什么?

一个例子是市场研究 Agent ,我试图提出制作什么视频或向社区提供什么产品或课程。

如果我有一个 Agent 可以出去并与 5% 的观众进行一对一对话,挖掘他们的痛点,并自动完成这些事情,那将非常棒。

你把这些小的用例堆叠起来,突然之间就有了一套对创作者非常有价值的 Agent 、 AI 或机器人。

Mark Zuckerberg

这是一个好观点。在商业环境中,这一点更清晰,企业需要客户支持,但更高一级的是能够汇总分析,了解人们需要支持的所有事项,并改进它们。

对于创作者来说,也有类似的版本,比如,我的社区如何喜欢与我的内容互动,不同的反馈是什么,我如何将这些因素纳入我的创作过程或商业模式中。

Robin Kallaway

我非常喜欢讨论未来的所有这些用例。我们都是技术乐观主义者,我相信几乎所有这些技术,从长远来看,都会对人类有净效益。但有一个大问题,我肯定你也经常听到,来自朋友、家人,我也在评论区经常听到。

基本上,很多人对 AI 有很多恐惧和不确定性,主要是因为创意人士和艺术家害怕 AI 可能会取代他们,抢走他们的工作。

我想起我的兄弟,他是一个出色的动画设计师,但他非常担心。他担心他所受的教育和培训,是否会因此而变得毫无意义。

对这一群体而言,听到像你这样的人分享关于 AI 驱动的未来的原始想法会非常有益。这对他们来说意味着什么?你能为他们提供一些心态或框架吗?

Mark Zuckerberg

我同意你所说的,未来将会有比现在更多的创意工作。你可以看一下人类的轨迹,大多数人过去是农民,但现在我们不需要那么多人从事农业了。

人们可以追求更有创意的事情。随着技术的发展,我们使用的工具也会发展。成为一个有才华的人,关键在于与这些工具保持同步。

但从根本上说,未来会有更多的创意机会,伴随着更强大的工具,让人们能够做到这一点。退一步说,我确实认为有一点让我感到困惑的是,行业中的一些人推动的叙事是,他们认为会有一个万能的 AI ,可以做所有事情。

我不认为事情会这样发展。我理解,如果你在某个 AI 实验室,你可能希望自己正在做的事情非常重要,然后你就会觉得,好的,我们在为未来构建唯一的东西。但现实情况并非如此。

这不像人们手机上的应用只有一个,人们只想从一个创作者那里获得所有内容。人们重视多样性,这创造了丰富性和我们在生活中学习和进步的感觉,体验不同种类的事物。

因此,我非常相信,未来不会只有一个 AI ,而是会有很多不同的 AI ,让很多不同的人能够创造不同的东西。这也是我如此信奉开源的部分原因。

我不认为 AI 技术应该被囤积,只有一家公司可以使用它来构建他们的中央产品。如果你相信最好的体验和最好的未来会有很多不同的 AI 和很多不同的体验,你就希望它能在各种方式中传播出去。

这部分是为创作者和平台用户构建工具,使他们能够创建自己的 AI ,就像UGC类型的 AI 情况,还有所有的商业内容。

另一部分是开源,这样其他公司也可以创建不同的东西,人们可以自己玩弄和修改。所以,我有一个非常深刻的世界观。当技术行业的人谈论构建这个唯一的 AI 时,我感到非常不舒服。

他们好像认为自己在创造上帝,但这不是我们在做的事情。我不认为事情会这样发展。显然,我们将在十年后使用与今天不同的工具,就像我们今天使用的工具与十年前不同一样。但这回到了你的主要观点,即未来将会有比今天更多的创意工作。

Robin Kallaway

我想到了数码相机。当时有很多摄影师,然后数码相机出现了,摄影的品味仍然很重要。他们只是得到了一个更好的工具,可能用于不同的用例。我非常同意你所说的,很多公司试图构建这种封闭的一体化平台,这对我来说也是一种打击,这比有益更具破坏性。

Mark Zuckerberg

这不会在世界上创造更多的价值。这是一个有点奇怪的意识形态,但从我的角度来看,我也认为这不是为人们创造最佳体验的方式。你想解锁并释放尽可能多的人来尝试不同的事情,这就是文化的本质。这不是一群人垄断一切,而是你希望有各种不同的想法在那里。

Robin Kallaway

完全同意。我想回到你之前提到的Ray-Ban Meta 。我使用它时感到非常震惊。音频、摄像头质量,以及多模型 AI 的结合,远远超出了我的预期。

我听过你分享的一个框架,即你认为像智能眼镜这样的设备可能会成为下一代的手机,而像 Quest 3 VR 这样的设备可能会成为下一代的计算机和电视。这对我来说很有意义。

作为一个产品构建者,我很好奇,Ray-Ban Meta 或智能眼镜,还需要什么才能让数十亿人更喜欢使用眼镜而不是手机作为主要硬件设备?

Mark Zuckerberg

这是个有趣的问题。如果你几年前甚至一年半前问我,我会说我们需要达到全息AR的水平,才能让这成为人们使用的主要平台。我们正在努力解决这个问题。我们从两个不同的方向攻击这个问题。

对于Ray-Ban Meta ,我们看了一下,问自己,如果我们只采用今天最好的眼镜形式因素,我们能在不影响形式因素、重量等方面的情况下,塞进多少技术。这就是我们得到的Ray-Ban Meta 。

但我们也从另一个角度出发,想要创造全息 AR。这仍然需要是眼镜,不是头戴设备,但可能会有稍厚的框架,因为你要塞入更多的技术。这不是我们拥有的原型版本,但我很兴奋,我们越来越接近展示它了。这不是最时尚的东西,但它是好的。它无疑是眼镜,而不是头戴设备。

随着时间的推移,这两条路径会逐渐融合。我以前认为我们需要全息来实现存在感,但 AI 取得了如此大的飞跃,即使是一个简单的产品也会更快地吸引人。

Ray-Ban Meta 产品的需求比我们预期的高得多,一方面,你喜欢看到这种情况,另一方面,我们没有生产足够的产品,这有点令人沮丧。

它在大多数款式中已经售罄,你仍然可以买到基本的黑色款,但很多人想要的其他款式已经售罄。我们正在加速生产和工厂生产线,以制造更多产品。

我现在的观点是,会有很多这样的产品。我实际上认为你可以用摄像头、麦克风和扬声器以及多模态 AI 创造一个很棒的体验,即使眼镜上没有任何显示器。事实上,有趣的是,显示器本身可能不会立即适合所有人,因为它增加了眼镜的重量,使它们变得更贵。

你可以以 300 美元的价格买到 Ray-Ban Meta ,但如果你添加全息显示器,那将显著增加成本,即使在可能实现的情况下,我们也能将其置于我们想要的形式因素中。

我仍然认为,对于能负担得起更昂贵设备且不介意其稍重的人,他们可能会想要全息功能。十年后,我们会得到真正小型的全息设备,那将非常棒。

但在近期内,我实际上认为很多人会更喜欢 Ray-Ban Meta 这样的产品。当然,我们会继续让这种形式因素随着时间的推移变得越来越小。所以这是一个非常令人兴奋的演变。

基本上会有三种不同的产品:

1)无显:一种是没有显示器的眼镜,只能进行 AI 操作,捕捉内容,可以听有声书、音乐、接电话等;

2)非全息:另一种是非全息显示器,意思是它不会像全息图那样覆盖你的整个视野。但它可能会有一点抬头显示,这会带来很多有趣的用例。你可以收到通知,发送消息,与 AI 对话,回答问题,不仅能听到,还能看到,这提供了更高的带宽。这会很令人兴奋,有很多小屏幕的用处,即使只是一个小小的抬头显示器。

3)全息:然后会有最顶级的版本,即全视野的全息显示器,我们在未来的对话中,你是坐在我客厅沙发上的全息图,或者你在这里,不仅仅是视频通话,不仅仅是屏幕上的全息图。

我们可以互动,你想玩牌,我们可以有一副全息图的牌。我们可以互动,乱搞同样的东西,你想一起创作艺术或内容,或者在白板上画画,都可以做这些事情。这将非常疯狂,这仍然是最终的方向。但我现在更乐观的是,即使在我们到达那里之前,这也将是一个大事件。

Robin Kallaway

那就像托尼·斯塔克的眼镜是最后一个用例。我听说过你提到过一个腕带,可以捕捉到皮下神经信号,我觉得这也很酷。

Mark Zuckerberg

那是什么样子?是神经腕带,神经接口腕带。当人们听到神经接口时,我想他们的第一个反应是,哦,这一定是植入你大脑的东西。但大多数人不想要什么东西植入他们的大脑。

我同意。但你的大脑通过神经系统向你的身体发送信号。那就是你如何激活所有肌肉的方式。

事实证明,有很多不同的路径在你身体的正常运作中并没有被使用。所以你可以有一个腕带,基本上训练它去捕捉你大脑通过不同路径传递的信号和方式,以不同于你通常的方式移动你的手。

最终你会达到这样一个程度,即使不明显移动你的手,你也能通过这个神经接口进行交流。所以它会从一些简单的动作开始。但在未来几年,你将能够用它打字,做各种事情,控制光标。这将是非常疯狂的。

所以,与眼镜结合将会带来一系列非常惊人的用例。即使只是一个抬头显示器版本或者甚至没有显示器。你基本上可以坐在那里,无论你在哪里,你都可以给某人或 AI 发送消息。

再一次,这不仅仅适用于 Meta ,随着时间的推移,它将适用于所有不同的 AI ,所有创作者的 AI ,任何你想互动的人。你可以坐在那里,默默地、谨慎地发送消息,然后你可以在耳边听到回答,或者如果你有显示器版本,可以看到小小的文字弹出。我觉得这会非常疯狂。

对我来说,最好的一点是,我更喜欢与人面对面交流。但对我来说,Zoom 上小组对话的最好部分之一是你可以有整个背后频道,在主要会议或对话进行的同时,你还可以与一部分人聊天,有时在会议中我有一个问题想问某人,但我不想在所有人面前问。所以我只能等到会议结束。

但在数字会议中,你可以在会议进行时给某人发信息,比如在 WhatsApp 上发消息。在面对面互动时也能通过眼镜做到这一点会很棒。你可以与人互动,但也可以在对话期间获取信息,使事情变得更加高效,这将非常强大。

Robin Kallaway

我以前低估了的一点是,手机会打破你的专注。当你在用手机时,你就完全在手机里,而不是在外界。但一旦你戴上眼镜,甚至没有抬头显示器,但有了它也不会分散你的注意力。你会非常专注。你可以在现实世界中,同时以混合的方式获取信息。这是一个非常有趣的平衡,有腕带和眼镜的结合。

Mark Zuckerberg

就像你说的,你问什么时候这会取代手机。在技术史上,新平台通常不会完全使人们停止使用旧的东西,只是你会用得更少。很多人今天在手机上做的事情,以前会在电脑上做,因为更方便。你不再那么频繁地打开电脑,不去书桌前,你只是直接在手机上完成。

即使我坐在书桌前,我也会在手机上做很多以前十到十五年前会在电脑上做的事情。眼镜也会这样发展。不是说我们会停止使用手机,只是它会更多地待在你的口袋里。你会在需要时拿出来,但越来越多的人会说,嘿,我可以用眼镜拍照,我可以向 AI 提问,或者发送消息,这样更方便。

我不会感到惊讶,如果十年后我们仍然有手机,但使用它们的方式会更加有意,而不是仅仅为了任何技术需求就随手拿起它。

这位腾讯&字节跳动的早期投资人表示,在这些新浪潮的开端,新的赢家在 10 年或 20 年后,有些是现有的公司,有些是新的公司。但那些变大的新公司,每年可能只有一家,不会更多……

Robin Kallaway

是的。我还有三个快速问题,然后就让你走。更多的是有趣的问题。第一个是,每隔几年,社会就会经历一些颠覆性的消费科技时刻。所以我想起第一次在 Google 上搜索,第一次在 Facebook 上收到好友请求,或者第一次叫 Uber。

人们几乎能记住他们第一次经历这些转变的时刻。你工作中最酷的部分之一是你可以提前五到十年体验这些颠覆性技术。我们谈到了眼镜,但我很好奇在未来十年的 Meta 路线图上,还有哪些技术有可能成为这些颠覆性的消费科技时刻?

Mark Zuckerberg

我完全同意你的观点。这是技术中最棒的部分之一。在很多其他领域,你可以做同样的事情很长时间,而在技术领域,每隔一段时间就会有一些新机会出现,你需要重新思考你在做什么,但这很令人兴奋。我不知道,我们已经讨论了很多内容,眼镜会是一个大事件。

我们几乎准备好开始展示全息眼镜的原型了。我们不会广泛销售原型,而是专注于构建完整的消费版本,而不是销售原型,但我们会开始向人们展示原型。这很疯狂。我展示给每个人,他们的反应都很兴奋。我非常期待展示给更多的人。所以,这神经腕带也很疯狂。你可以通过微妙的手部动作输入信息,仅仅通过想象你如何移动手。

随着时间推移,这将变得更加丰富。通常需要到第二版或第三版,这些东西才能真正调试好,人们才能理解。我们在Ray-Ban Meta 的第二版也看到了这一点,它真的大受欢迎。但神经腕带将是一个大事件。

根据进展,它可能主要用于眼镜和混合现实头戴设备的输入,或者最终成为一个独立的平台。你可以想象一个世界,你用神经腕带控制家里的所有设备或电脑,随着时间推移,这将非常酷。

在 AI 方面,进展的速度非常惊人。我们从去年夏天的 Llama2 到现在的 Llama3 , Llama2 不是最先进的, Llama3 接近赶上最好的模型了。

这是开源的,向很多人开放,解锁了很多很棒的东西。我们开始研究 Llama4 ,我对此很兴奋。每个版本都增加了更多的模式。Llama3 有更多的图像模式和一些语音内容, Llama4 将更深入这些方面,并增加一些推理能力。

这样,当你是创作者并在编辑某些内容时,你不需要非常详细地描述你在做什么。你可以来回交流,尝试不同的想法。这将非常吸引人。当它从回合制聊天机器人转变为你可以给出意图并完成更复杂的任务的 Agent 时,这将非常酷。

所以我不知道,但我确实认为我们在创作者 AI 方面开始的旅程将是一个有趣的开始。现在很多人体验这些 AI 是通过几个公司构建的主要 AI 。创作者 AI 和我们推出的一些商业 AI 将使人们开始与更多样化的体验互动,这将为整个生态系统增加真正的丰富性,非常棒。

Robin Kallaway

我完全同意,有时候这只是一个新应用程序或以不同方式打包。就像我们谈到的主题,从单一到多样化。这里有一个有趣的问题,关于创作者方面的。我想我从未听过你回答这个问题。

你是一个非常多产的创作者。你设计自己的衣服,制作音乐。我听说过你的“Mark 肉品”(MarksMeats),还有你所有的爱好。很多创作者都会被问到一个问题,我也经常被问到,如果我要从头开始在网上建立一个品牌或围绕一个爱好建立品牌,我该怎么做?我很好奇你会怎么回答这个问题。

比如说,你只是一个吉他手Mark,或者“Mark 肉品”的创始人 Mark。你知道关于世界构建、粉丝心理学的一切知识,但我们拿走了所有资源。你会如何看待这个挑战?如何作为企业家尝试在线上建立一个有意义的品牌?

Mark Zuckerberg

这很有趣。我们现在几乎已经被反射性地训练去思考这些东西。对于“Mark 肉品”的例子,我并不是想围绕它创建一个商业,但我本能地从背后的故事来思考它。我们不仅仅是要养牛,我们试图在夏威夷养出高质量的牛,我们喂它们这种独特的夏威夷果餐,我们酿造啤酒并喂它们喝。我们垂直整合,我们种植夏威夷果树,酿造啤酒。我发现这就是它有趣的部分,每个人都以独特的方式做事情。

也许有一天当我退休时,“Mark 肉品”会成为一个商业运营,但现在只是想做这件很棒的事情,让它变得很棒的一部分是围绕它有一个叙述和故事。

社交媒体和其他在线工具帮助人们讲述这个故事,但这也在某种程度上训练我们去思考事情的叙述和故事是什么,这是一个有趣的问题。


 
最新文章
相关阅读