黄仁勋对话扎克伯格:AI的未来
laodang @ 2024年07月31日 财经风云
黄仁勋对话扎克伯格:AI的未来 张雅琦、赵颖 7 月 30 日早上 6 点,英伟达 CEO黄仁勋与 Meta 创始人&CEO 扎克伯格在 SIGGRAPH 2024 上展开了对谈,两位大佬共同探讨了加速计算、生成式 AI 以及推动下一波创新、虚拟世界和机器人技术突破的研究。 黄仁勋和扎克伯格同台畅谈AI,并互换外套表达"兄弟情深"。 当地时间7月29日,在美国丹佛举行的SIGGRAPH 2024大会上,英伟达CEO黄仁勋和Meta创始人扎克伯格进行对谈,共同讨论了人工智能和仿真模拟的未来,机器人技术智能眼镜以及开源哲学。 在这场长达一小时的对谈中,扎克伯格谈到了AI聊天机器人未来的愿景。他指出未来的 AI 将不仅用于内容推荐系统,还将用于即时内容生成和从现有内容中整合新内容,这将彻底改变 Instagram 和 Facebook 等平台的信息流和推荐系统。 黄仁勋还称赞了Meta的新开源模型Llama 3.1。扎克伯格谈及苹果的封闭系统影响,使他意识到开源的重要性:"开源使我们的AI生态系统更强大,不是因为利他,而是因为这样会更好用。" 克伯格提到智能眼镜,他原以为全息AR眼镜会在AI之前出现,但智能眼镜仍是下一代计算平台的移动版本。"我们离拥有全息眼镜还有一段时间。不过,我认为在一副时尚的、更厚框架的眼镜中实现这一点并不遥远。" 谈话中,黄仁勋提到扎克伯格做客时,两人一起准备芝士牛排三明治,扎克伯格切番茄时,每片都切得一样薄,摆得整整齐齐,黄仁勋笑称:"这就是为什么他需要不会审判他的AI。" 在对话快要结束时,黄仁勋和扎克伯格还互相送给了对方一件皮衣。扎克伯格回应黄仁勋称,这就更值钱了,因为它被(你)穿过了。 以下是对谈全文: 黄仁勋 欢迎马克,欢迎第一次来SIGGRAPH,作为计算机的先驱之一,现代计算机的推动者,我不得不邀请他来。 你知道,这些90%的博士。正如你所知,SIGGRAPH真正伟大的地方在于它展示了计算机图形学、图像处理、人工智能和机器人技术的结合。多年来,一些公司展示和揭示了惊人的事物,包括迪士尼、皮克斯、Adobe、Epic Games,当然还有英伟达。今年我们在这里做了很多工作,我们介绍了20篇人工智能与仿真交叉领域的论文。我们正在使用AI来帮助模拟更大规模、更高速度的计算,例如,可微分物理学,我们使用模拟来创建合成数据生成的模拟环境, 这两个领域真的走到了一起。 Meta所做的工作日本丰田BF·令人自豪,你们在AI方面做了惊人的工作。媒体常常写到Meta在过去几年里是如何进入AI领域的,就像你知道的,我们一直使用Meta推出的PyTorch,你们在计算机视觉、语言模型、实时翻译等方面所做的开创性工作令人瞩目。我的第一个问题是,你怎么看待今天生成AI和Meta的进步?以及如何将其应用于增强你的运营或引入新功能? 扎克伯格 是的,有很多东西要解答。首先,很高兴来到这里。Meta已经在AI领域做了大量工作。虽然我们与英伟达相比是新手,但我们也在不断进步。谢谢你的邀请。 早在2018年,我们就展示了VR和混合现实耳机的一些早期手部跟踪工作,我想我们已经谈了很多关于我们在Codec Avat AR方面取得的成就进展,我们希望能够通过消费级头戴设备来驱动的照片级逼真的化身,我们越来越接近了,所以对此感到非常兴奋。我们已经完成了很多显示系统的工作,我们展示了很多未来的原型和研究,以便使混合现实头戴设备能够非常薄,但具有相当先进的光学堆叠、显示系统和集成系统。 扎克伯格 很高兴来到这里。今年不仅仅是讨论元宇宙的东西,还有所有AI的部分。我们成立FAIR人工智能研究中心时,当时是Facebook,现在是Meta。在我们开始FAIR之前,我们已经做了一段时间了,关于人工智能时代的所有事情,这是一场有趣的革命。 我认为它最终会以一种不同的有趣方式制造出我们所做的不同产品。你可以看看我们已经拥有的主要产品线,比如Instagram和Facebook上的信息流和推荐系统,我们一直在这个过程中,从单纯关注与朋友的联系和排名一直很重要,因为即使你只是关注朋友,如果有人做了非常重要的事情,比如你的表哥生了孩子之类的,你会希望出现在顶部。我们如果被埋在你的动态中,你会很生气。你对我们非常重要,所以推荐系统很重要。 扎克伯格 在过去的几年里,已经到了一个点,更多的东西只是不同的公共内容。推荐系统非常重要,因为现在不仅仅是来自朋友的几千个或几千个潜在的候选帖子,而是有数百万条内容,这变成了一个非常有趣的推荐问题。有了生成式AI,我想我们很快就会进入一个区域,你今天在Instagram上看到的大部分内容,只要是来自世界上与你的兴趣相匹配的东西就会被推荐给你,无论你是否关注这些人。 我认为在未来,很多东西都会用AI工具来创造。其中一些将是创作者使用工具来创建新内容,最终会是为你即时创建的内容,或者是从不同的内容收集和综合成的内容。这只是我们正在做的核心部分如何演变的一个例子,而这已经在过去20年中不断演变。 黄仁勋 人们认识到,世界上最大的计算系统之一就是推荐系统。 扎克伯格 我的意思是,这是完全不同的路径,它不是那种人们谈论的生成式 AI 的热点,但就像所有的 Transformer 架构一样,它拥有相似之处,只是建立越来越多的通用模型。 黄仁勋 将非格式化数据嵌入特征中。 扎克伯格 是的,推动质量改进的一个重要因素是,过去多种类型的内容都有不同的模型。最近的一个例子是,我们有一个用于排名和推荐短视频的模型,另一个用于排名和推荐更多长视频的模型。然后,做一些产品工作,基本上使系统可以显示任何符合条件的内容。你越是创建更多可以涵盖所有内容的通用推荐模型,它就会构建得越好。 我认为,随着模型变得越来越大、越来越普遍,这也变得越来越好。所以我有一天有一个梦想,就像你几乎可以想象所有的 Facebook 或 Instagram,就像一个单一的AI模型,将所有这些不同的内容类型和系统统一在一起,实际上在不同的时间框架内有不同的目标。有些只是向你展示因为你今天想看到的有趣的内容是什么,但其中一些帮助你长期建立你的网络,比如你可能认识的人或想关注的账号。 黄仁勋 这些多模态模型往往更擅长识别模式、弱信号。AI在你的公司里如此深入,您已经构建GPU基础设施,运行这些大型推荐系统很长时间了。 不过一旦你开始进入这个领域,你就会深入其中。你深入其中,并且非常投入。如今,当我使用 WhatsApp 时,我感觉自己在与WhatsApp合作。我喜欢想象,当我打字时,它会生成图像。我回过头来改变我的话语,它又会生成其他图像。 扎克伯格 是的,那是上周的事了,对此感到兴奋。在过去的一周里,我花了很多时间和女儿们一起想象她们成为美人鱼之类的东西,这很有趣。我的意思是,那是它的另一半。 一方面,许多生成式 AI 的东西,它将成为所有我们长期以来的工作流程和产品的重大升级。 但另一方面,现在会有所有全新的东西可以被创造出来。Meta AI 的想法是拥有一个 AI 助手,可以帮助你完成不同任务,并且非常具有创造性。像你所说的那样。它们非常通用,所以你不需要仅限于此,它将能够回答任何问题。 当我们从像Llama 3级别的模型转移到Llama 4及更高级别时,它会感觉不像一个聊天机器人,就像你给它一个提示,它就会做出回应。然后你给出提示,它会回应,就像来回一样。我认为它会很快演变成你给它一个意图,它实际上可以在多个时间范围内工作。它可能应该知道你事先给了它一个意图。如果我认为的一些东西最终会出现,它会启动,计算工作需要几周或几个月左右,然后就回到你身边,然后回来告诉你发生了什么事情,这将会非常强大。 黄仁勋 今天的AI如你所知,是一种回合制,是有些单调。我们思考当我们被赋予一个任务或我们正在给出一个问题时,什么会考虑多个选项,或者我们想出一个选项树,一个决策树,然后我们沿着决策树,在脑海中模拟我们可能做出的每个决策的不同结果。所以我们在做计划。在未来,AI也会这样做。 扎克伯格 是的,所以我们实际上正在讨论这个问题,但今天我们会更广泛地推广它。我们很多的愿景是,我不认为只有一个AI模型,他们像是在构建一个集成的AI Agent。我们的很多愿景是,希望授权所有使用我们产品的人为自己创建Agent。 无论是平台上的数百万创作者还是小企业,我们希望最终能够整合所有的内容,迅速建立商业Agent,并能够与客户互动,进行销售和客户支持等。所以我们现在才开始推出更多AI Studio,它基本上是一组工具,最终姜维每个创作者都构建一个AI版本的自己,作为他们可以互动的代理或助手。 这里有一个基本问题,就是一天的时间不够,如果你是一个创作者,想更多地与社区互动但时间有限。所以下一个就是让人们创造这些Agent,它是一个Agent,但你训练它在你的材料上以你想要的方式代表你。我认为这是一种非常有创意的努力,几乎就像你发布的一件艺术品或内容。需要非常明确的是,它并没有与创作者本身互动。但我认为这将是另一种有趣的方式,就像创作者如何在这些社交系统上发布内容一样,能够让代理这样做。 同样地,我认为人们可以进行微调和培训,为不同的用途创建Agent。其中一些将是娱乐,某些人创造的东西只是搞笑和不同方式的搞怪,或带有一种有趣的态度,这些可能我们不会在 Meta AI 作为助手中构建进去,但人们对此非常感兴趣,想要与之互动。 然后,一个有趣的用例是人们使用这些 Agent 进行支持,这 Meta AI 的一个主要用例是人们基本上用它来模拟社交场景,不论是专业场景,例如"我想向经理询问如何获得晋升或加薪?"或者是和朋友的争执,或者是和女朋友的困难情况,模拟这种对话,看看对话会如何进行,并获得反馈。 很多人不仅仅想和代理互动,不论是MetaAI还是ChatGPT或其他人使用的东西,他们想创造自己的东西。这大概就是我们AI Studio的目标,但这都是这个更大的远景一部分,我们认为不应该只有一个大AI让人们互动。我们认为如果有各种不同的东西,世界会更好、更有趣。 黄仁勋: 这些不同的事情。我觉得很酷,如果你是一名艺术家,你有自己的风格、你所有的作品,微调成一个AI的模型,你可以让AI按照自己的艺术风格创作一些东西。 扎克伯格: 是的,我的意思是,就像企业都会像有电子邮件地址、网站和社交媒体账号一样,未来企业拥有一个 AI Agent 来与客户互动。历史上这些事情一直很难做到。如果你考虑任何公司,可能会有客户支持部门,这和销售部门是分开的,而作为 CEO 你不希望这种情况,因为这是不同的技能。 扎克伯格: 我想这就是,当你是 CEO 时,你必须做所有的事情。但当你在组织中构建抽象层时,很多时候这些组织是分开的,因为它们为了不同的目标而优化,理想的情况是它们是一个整体。作为客户,你不在乎在买东西时和遇到问题时会走不同的路径,你只希望有一个地方可以解答你的问题并与企业互动。这对创作者也适用。对消费者而言,这些与客户的互动。 黄仁勋: 与客户的互动,特别是他们的投诉,将使您的公司变得更好。这一切都与AI有关,将捕获机构知识,以及如何以及所有这些都可以进入分析,从而改进AI等等。 扎克伯格: 所以我认为这个商业版本有更多的集成,我们仍然处于相当早期阶段。但是AI工作室让人们可以创造他们的UGC Agent 和不同的东西,在这个飞轮上起步。我对此非常兴奋。 黄仁勋 那么,我可以使用AI工作室来微调我的图像集合吗? 扎克伯格 是的,我们会到做到的。 黄仁勋 我可以加载我写的所有东西,以便将其用作我的素材。基本上,每次我回到它,它又重新加载它的记忆。所以它记得上次停下来的地方。我们继续我们的谈话,就像什么都没发生过一样。 像任何产品一样,它会随着时间的推移变得更好,训练工具也会变得更好。这不仅仅是关于你想让它说什么。我认为创作者和企业通常都希望能够自由控制,而不仅仅是被动接受,所以在所有这些方面都变得更好了。 扎克伯格 理想情况是,不只是文字,你几乎希望能够进行视频聊天,这与我们正在做的一些编解码器头像工作有交集。我们会实现这一点。这些东西离我们并不远,飞轮转得很快。这很令人兴奋。有很多新东西要做。即使基础模型的进展现在停止了,我们有五年的产品创新期来弄清楚如何最有效地使用已有的东西。但实际上基础模型和基础研究的进展在加速,这是一个相当疯狂的时代。 黄仁勋 我将能够继续前进。让我这么说吧。我喜欢你的愿景,每个人都可以有一个AI,每个企业都可以在我们公司有一个AI。我希望每个工程师和每个软件开发人员都有一个AI。我喜欢你的愿景,因为你也相信每个人和每个公司都应该能够制定自己的AI。所以你开源了Llama,我认为这很棒。Llama 2.1,顺便说一下,我认为Llama 2可能是去年AI最大的事件。这就是原因。 扎克伯格 我以为是H100,但你知道,这很遗憾。 黄仁勋 这是一个典型的「先有鸡还是先有蛋」的问题。是的,哪一个先来? 扎克伯格: H100,实际上,Llama 2 并不是基于 A100 的。 黄仁勋 我之所以说这是最大的事件,是因为它激活了每个公司、每个企业和每个行业。突然间,每家医疗保健公司都在构建人工智能,每家公司都在构建AI,每家大公司、小公司、初创公司都在构建人工智能。这使得每个研究人员都有可能重新接触AI,因为他们有一个起点可以做些什么。 然后现在3.1发布了,令人兴奋的是我们一起努力部署3.1。我们将把它带到全球企业中,激动人心,我认为它将使各种应用程序成为可能。 但是告诉我你的开源理念是从哪里来的?你开源了PyTorch,它现在是完成AI的框架。现在你已经开源了Llama 3.1,围绕它建立了一个完整的生态系统。我认为这很棒。但这一切是从哪里来的? 扎克伯格 是的,很多事情都有很多历史。我们加班做了很多开源工作。我认为其中一部分,坦率地说,我们在其他一些科技公司之后开始建设分布式计算基础设施和数据中心。正因为如此,当我们建造这些东西的时候,它已经不是竞争优势了。就像,好吧,我们不妨把它开放,然后我们将从周围的生态系统中受益。所以我们有很多这样的项目。我认为最大的一个可能是开放计算,我们采用了我们的服务器设计和网络设计,最终是数据中心设计并发布了所有这些。通过让它成为某种行业标准,所有的供应链基本上都围绕它组织起来,这为每个人节省了钱。通过公开和开放,我们从中获得了数十亿美元的收益。 黄仁勋 开放计算也是让我们为一个数据中心设计的Nvidia HGX成为可能的原因,它也适用于每个数据中心。真棒。 扎克伯格 我们觉得那是一次很棒的经历。然后,我们已经用一堆基础设施工具做到了这一点,比如React PyTorch。所以我想说,当Llama出现的时候,我们倾向于为 AI 模型做这件事。我想有几种方式可以看待这件事。意思是,过去 20 年在公司里建造东西真的很有趣。其中最困难的事情之一是不得不处理我们通过竞争对手的移动平台发布应用的事实。所以一方面,移动平台对整个行业来说是一个巨大的推动力,这非常棒。另一方面,通过竞争对手的平台来发布你的产品是有挑战性的。我也成长在一个时代,那时 Facebook 的第一版是在网页上,是开放的。然后当它转向移动端时,好处是每个人都有一个计算机在他们的口袋里,这很棒。但缺点是,我们在可以做的事情上受到了更多的限制。 所以当你观察这些计算时代时,有一种很大的近期偏见,每个人都只关注移动端,认为,好吧,因为封闭的生态系统,苹果基本上赢了,并设定了这些条件。比如,是的,我知道实际上有更多 Android 手机,但苹果基本上占据了更大的市场份额。并且,所有的利润都集中在苹果身上。在发展上,Android 基本上都在追随苹果。所以我认为苹果在这一代中显然是赢家,但情况并不总是如此。如果你回顾过去,苹果在封闭系统方面有所作为。但微软,虽然它不是一个完全开放的公司,但与苹果相比,Windows 运行在所有不同的 OEM 和不同的软件、硬件上,形成了一个更加开放的生态系统。在个人电脑时代,Windows 是领先的生态系统,可以看作是开放生态系统 1。 我对下一代的计算抱有希望,那就是我们将会回到开放生态系统占主导地位的那个时代。再次强调,总是会有封闭的和开放的两种选择。我认为两者都有其合理性,都有其好处。我并不是在这个问题上偏执。我的意思是,我们确实会做一些封闭源代码的项目。我们发布的并不都是开源的。但我认为,对于整个行业正在构建的计算平台,尤其是软件开源,这将为整个行业带来巨大的价值。因此,这确实影响了我对 AI 和 Llama,以及我们在 AR 和 VR 领域所做工作的看法。我们基本上是在为混合现实构建 Horizon OS,类似于 Android 或 Windows 的开放操作系统。 基本上,我们想让所有不同种类的设备都能工作。我们基本上只是想让生态系统恢复到那个水平,即成为一个开放的平台。我对下一代技术持乐观态度,尤其是开放技术方面将取得胜利。我只是想确保我们有使用权。这可能有点自私,但我的目标是,在接下来的 10 到 15 年里,确保我们能够构建我们用来构建社交体验的基础技术。我想要构建很多东西,然后却被平台提供商告知「不,你不能真正构建它」,在某种程度上,我就想说「nah, fuck that」。为了下一代,我们想要从头开始建造,并确保它去向何方。 黄仁勋: 我们的广播机会去哪了。 扎克伯格 抱歉。我猜我嘟嘟了。是的,你知道,我们在20分钟内还可以,不过让我谈论封闭的平台,我会很生气。 黄仁勋 嘿,看,太棒了。我认为这是一个伟大的世界,有人致力于建造最好的AI,无论他们如何建造和制造,他们都把它作为一种服务提供给世界。但是如果你想建立自己的AI,你仍然可以建立自己的AI。所以,是的,完全有能力写作,使用AI,有很多东西。我宁愿不自己做这件夹克。我更喜欢为我做这件夹克。皮革可以开源这一事实对我来说并不是一个有用的概念。但我认为你可以有很棒的服务,令人难以置信的服务,以及开放的服务,开放一点。是的,然后我们基本上有了整个光谱。但是你用3.1做的事情真的很棒,你有4,5B,你有70B,你有8B,你可以用它来生成合成数据,使用更大的模型来教授这些模型。尽管较大的模型会更通用,但它不那么脆弱,你仍然可以构建一个更小的模型,适合你想要的任何运营领域或运营成本。 你遇到了一个守卫,我认为是 Llama 守卫的护栏,非常棒。因此,现在你建立模型的方式是透明的。你有世界一流的安全团队和伦理团队。你可以以这样的方式建立它,让每个人都知道它是如何正确建立的。我真的很喜欢这一点。 扎克伯格 是的,我的意思是,在我因为绕路而被转移到那里之前,我想完成这个想法。我确实认为有这种对齐,我们正在构建它,因为我们希望这个东西存在,我们想把它从一些封闭的模型中切断,对吧?而且,这不仅仅是你可以构建的软件。你需要一个生态系统,对吧?所以如果我们不开源它,它几乎不会很好地工作。我们这样做不是因为我们是利他主义者,尽管我认为这对生态系统有帮助。我们这样做是因为我们认为这将使我们正在建造的东西成为最好的,因为它有一个强大的生态系统。 黄仁勋 有多少人为PyTorch生态系统做出了贡献。是的,完全正确。仅英伟达一家,我们可能就有几百人致力于使PyTorch更好、更具可扩展性、更高效等等。 扎克伯格 而且当某件事成为行业标准时,其他人会绕过它。所以系统中的所有硅最终都会被优化以使其运行良好,这将使每个人受益,但它也将与我们正在构建的系统很好地配合使用。我认为,这只是一个例子,说明这最终是非常有效的。所以,我的意思是,我认为开源策略会是一个好的策略。作为一种商业策略,我认为人们仍然不太清楚。 黄仁勋 我们非常喜欢它。我们围绕它建立了一个生态系统。我们建造了我发现的这个东西。 扎克伯格 你们一直很棒。每次我们发货时,你们都是第一个发布并优化并使其工作的人。所以,我很感激,亚当。 黄仁勋 我能说什么呢?我们有优秀的工程师,还有你。 扎克伯格 总是快速地跳上这些东西。 黄仁勋 是的,我非常支持,我是老年人,但我很敏捷。这就是CEO必须做的。我认识到一件重要的事情。我认为喇嘛真的很重要。我们建立了一个叫做AI工厂的概念,AI铸造厂,这样我们就可以帮助每个人建造,很多人都有建造AI的愿望。对他们来说,拥有AI非常重要,因为一旦他们把它放入他们的飞轮,他们的数据飞轮,这就是他们公司的机构知识被编码和嵌入AI的方式。所以他们负担不起在其他地方拥有AI飞轮、数据飞轮和体验飞轮。所以开源允许他们这样做,但是他们不知道如何把整个事情变成一个AI。 所以我们创建了这个叫做AI铸造厂的东西。我们提供工具,我们提供专业知识,Lama技术。我们有能力帮助他们把这整件事变成一项AI服务。然后当我们完成时,他们拿走了它,他们拥有它。它的输出就是我们所说的Nim。这个Nim,这个Neuro微服务,Nvidia推理微服务,他们只是下载它,他们拿走它,然后在他们喜欢的任何地方运行它,包括本地。我们有一个完整的合作伙伴生态系统,从原始设备制造商可以运行Nims到GSI,例如埃森哲,我们培训和合作创建基于羊驼的MEM和管道。现在我们正在帮助世界各地的企业做到这一点。我的意思是,这真的是非常令人兴奋的事情,真的都是由拉玛开源引发的。 扎克伯格 是的,我认为特别是帮助人们从大型模型中提取自己的模型的能力将是一个非常有价值的新事物。因为我们在产品方面谈论的那样,至少我不认为会有一个每个人都与之交谈的主要AI代理商。我不认为每个人都会使用一个模型。 黄仁勋 芯片AI、芯片设计AI。我们有一个软件编码AI。我们的软件编码AI理解USD,因为我们USDOmniverse的东西。我们有一个了解Verilog的软件AI。我们的Verilog,我们有一个,我们有软件AI,它了解我们的错误数据库,知道如何帮助我们分类错误并将其发送给合适的工程师。因此,这些AI中的每一个都根据羊驼进行了微调。所以我们微调它们,我们保护它们。 你知道,如果我们有一个芯片设计的AI设计,我们对询问政治、宗教之类的事情不感兴趣。所以我们护栏它。我认为每家公司基本上都会拥有,对于他们拥有的每一个功能,他们可能会拥有为此而构建的人工智能,他们需要帮助来做到这一点。 扎克伯格 是的,我认为这将是未来的一个重要问题,人们在多大程度上只是使用更大、更复杂的模型,而不是训练自己的模型以适应他们的用途。至少我敢打赌,它们将只是不同模型的大量扩散。 黄仁勋 最大的原因是因为我们的工程师,他们的时间非常宝贵。所以我们现在正在优化405B。如你所知,4或5B不适合任何图形处理器,不管有多大。这就是为什么MV性能如此重要。我们有这个,我们的每一个GP都是通过这个叫做链路开关的MV无阻塞开关连接的。例如,在HGF中,有两个这样的开关,我们使所有这些GPU都可以工作并运行4或5B。 真正的表现。我们这样做的原因是因为工程师的时间对我们来说非常宝贵。我们想使用最好的模型。它的成本效益只需几分钱,谁在乎呢?所以我们只是想确保最好的结果呈现给他们。 扎克伯格 是的,我认为4或5B是GPT-4模型推理成本的一半。所以,在那个水平上,它已经相当不错了。但我认为人们正在使用设备或想要更小的型号。他们只是要把它蒸馏下来。所以这就像是一套完全不同的服务。 黄仁勋 AI正在运行。让我们假设我们雇佣的芯片设计AI可能是每小时10美元。你在使用,如果你一直在使用它,并且你在一大群工程师中分享AI。所以每个工程师可能都有一个AI和他们坐在一起,成本不高。我们付给工程师很多钱。所以对我们来说,每小时几美元放大了某人的能力,那真的很有价值。 扎克伯格 你不需要说服我。 黄仁勋 如果你还没有雇佣AI,马上去做。这就是我们要说的全部。让我们谈谈下一波。我非常喜欢你们工作的一件事,计算机视觉。我们内部经常使用的模型之一是分段一切。我们现在正在用视频训练AI模型。这样我们就可以理解世界,为机器人技术和工业数字化建模,并将这些AI模型连接到全方位,这样我们就可以更好地建模和代表物理世界,让机器人更好地在这些全方位的世界中运行。你的应用,射线带元玻璃,你把AI带入虚拟世界的愿景真的很有趣。告诉我们那个。 扎克伯格 好的,里面有很多需要解决的问题。你所说的任何部分模型,我们实际上正在展示,我认为,在siggraph这里的下一个版本,任何部分2。是的,它现在起作用了。它更快。它适用于视频。我想这些实际上是来自我在卡哇伊牧场的牛。 黄仁勋 但顺便说一下,这些被称为恶意标记。 所以马克来到我家,我们一起做了费城芝士牛肉三明治。下次你带东西的时候。 扎克伯格 做了。真的很好。 黄仁勋 那是苏厨师的评论。好的,听着,然后在。 扎克伯格 晚上结束时,你说,嘿,你吃得够多了,对吧?我想,我不知道,我可以再吃一个。你就像,真的吗? 黄仁勋 你知道,通常当你说你更大的时候。 扎克伯格 是的,我肯定会说,是的,我们正在生产更多的鞋子。你得到了吗? 黄仁勋 够吃吗?通常你的客人会说,哦,是的,我很好。 扎克伯格 再给我做一个芝士蛋糕。詹森。 黄仁勋 所以只是想让你知道他有多强迫症。所以我转过身,我正在准备芝士蛋糕,我说,马克,切番茄。所以马克,我递给他一把刀。 扎克伯格 我是一名精密切割机。 黄仁勋 所以他切番茄。每一个都完美地精确到毫米。但真正有趣的是,我期望所有的番茄都被切片并堆叠起来,就像一副纸牌一样。但是当我转身时,他说他需要另一个盘子。原因是因为他切下的所有番茄,一旦他将一片番茄与另一片番茄分开,它们就不会再接触了。 扎克伯格 看,伙计,如果你想让他们碰,你需要告诉我你需要。好的。 黄仁勋 这就是为什么他需要一个不会评判的AI。 扎克伯格 是的,就像。 黄仁勋 所以这很酷。好的,所以它正在识别奶牛的轨迹。它识别追踪奶牛。 扎克伯格 所以可以用这个制作很多有趣的效果。而且因为它将开放,行业内还有许多更严肃的场所。所以,是的,我的意思是,科学家们用这些东西来研究珊瑚礁和自然栖息地,以及景观的演变等等。但我的意思是,能够在视频中做到这一点,并进行B 0拍摄,并能够与之互动,告诉它你想要跟踪什么,这是非常酷的研究。 黄仁勋 例如,我们使用它的原因,例如,你有一个仓库,有一大堆摄像头,仓库AI正在监视发生的一切。比方说,你知道,一堆盒子掉了下来,或者有人把水洒在地上,或者,你知道,无论什么事故即将发生,AI都会识别它,生成文本,派人,你知道,沿途帮助。所以这是使用它的一种方式,而不是在发生事故时记录所有内容,开始记录每一个纳秒的视频,然后返回并检索那一刻。它只是记录重要的东西,因为它知道自己在看什么。因此,拥有一个视频理解模型,一个视频语言模型对于所有这些有趣的应用程序来说都非常强大。现在,除了Ray Talk,你们还打算做什么?跟我谈谈。 扎克伯格 有所有聪明的课程。所以我认为当我们考虑下一个计算平台时,我们将其分解为混合现实、耳机、智能课程和智能眼镜。我认为人们更容易理解并戴上它,因为几乎每个今天戴眼镜的人都会升级到智能课程。这相当于世界上超过十亿人。所以这将是一件相当大的事情。 VRMR耳机,我认为有些人觉得它对游戏或其他用途很有趣,有些人还没有。我的观点是他们两个都会出现在世界上。我认为智能课程将成为下一个计算平台的手机版本。混合现实头戴式显示器将更像您的工作站或游戏机,当您坐下来进行更身临其境的会话并希望访问更多计算时。我的意思是,眼镜的外形非常小。这会有很多限制,就像你不能在手机上进行相同级别的计算一样。 黄仁勋 它恰好发生在所有这些生成AI突破的时候。 扎克伯格 所以我们基本上,对于智能课程,我们一直从两个不同的方向来解决这个问题。一方面,我们一直在构建我们认为是理想全息AR眼镜所需的技术。我们正在做所有定制的硅工作,所有定制的显示堆栈工作,就像你需要做的所有事情,让它们在他们的眼镜上工作,对吧?这不是耳机。它不像VRMR耳机。它们看起来像眼镜,但与你现在戴的眼镜还有相当大的差距。我的意思是,那些非常薄。但是即使是我们制造的射线带,你也不能完全适应你需要的所有技术,但对于全息AR,尽管我们正在接近,在接下来的几年里,我认为我们基本上会接近。它仍然会相当昂贵,但我认为它将开始成为一种产品。 另一个角度是,让我们与世界上最好的眼镜制造商Estelor Luxatka合作,从好看的眼镜开始。他们基本上制造,他们拥有你使用的所有大品牌。你知道,它是雷班、奥克利、奥利弗·皮普尔斯或其他几个人。是的,有点像Estellar,Luxatka。 黄仁勋 英伟达眼镜。 扎克伯格 我,我认为,他们可能会喜欢这个比喻。但是,此时此刻谁不会呢?所以我们一直在和他们一起研究射线带。我们是第二代。目标是,好吧,让我们将形式因素限制在看起来很棒的想法上。在此基础上,让我们投入尽可能多的技术,理解我们不会在技术上达到我们想要的理想状态,但它会,最终,会像漂亮的眼镜一样。 我们现在有相机传感器,所以你可以拍照和录像。你实际上可以在Instagram上直播。你可以在WhatsApp上进行视频通话,并将你所看到的内容流式传输给其他人。它有麦克风和扬声器。扬声器实际上非常好。它是敞开的耳朵。所以很多人觉得它比耳塞更舒适。你可以听音乐,就像这种私人体验一样。那相当不错。人们喜欢那个。你用它接电话,但后来发现传感器包正是你需要的,你也可以和AI说话。是的,所以如果你五年前问我,我们会在AI之前得到全息AR,那是一种意外,我会说,是的,可能。我的意思是,这似乎只是图形和显示的进展,在所有虚拟和混合现实的东西上,并建立新的显示堆栈。我们正在不断朝着那个方向前进。 然后这个突破发生在LLMs上,结果是我们现在有了非常高质量的AI,并且在全息AR之前以非常快的速度变得更好。 是的,这是一种我没有预料到的倒置。我们幸运地处于良好的位置,因为我们正在开发所有这些不同的产品。但我认为你最终会得到一系列不同的潜在眼镜产品,价格不同,技术水平不同。所以我认为基于我们现在看到的射线带元数据,我想以300美元的价格点显示更少AI眼镜将是一个非常大的产品,最终将有数千万或数亿人拥有。 黄仁勋 所以你会有超级互动的AI和你说话。是的,视觉,你刚刚展示了你对视觉语言的理解。你有实时翻译。你可以用一种语言和我交谈。我听到另一种语言。 扎克伯格 然后显示屏显然也会很棒。是的,但这会增加眼镜的重量,使它们更加昂贵。所以我认为会有很多人想要全息显示。但也会有很多人,他们想要一些最终会像非常薄的眼镜一样的东西。 黄仁勋 好吧,对于工业应用程序和一些工作应用程序位置,我们需要它。 扎克伯格 想想,对于消费品也是如此。你这么认为?是的,我认为,在Covid期间,我经常思考这个问题,当时每个人都有点疏远。就像你把所有的时间都花在了视频会议上。我们有这个真是太好了。但在未来,我们离能够进行虚拟会议的时间并不多,就像我不在这里。这只是我的全息图。就像,感觉我们就在那里,我们身临其境。我们可以一起工作和合作。但我认为这将特别重要。 黄仁勋 AI耐心。我可以和一个我不经常戴的设备一起生活。 扎克伯格 但我认为我们会到达它实际存在的地步。是的,我可以。它会是,有内置眼镜,有更薄的镜框和更厚的镜框,所有这些款式都有相似之处。但是我不认为我们离拥有完整的全息眼镜还有一段时间,但我认为拥有一副时尚的更厚的框架眼镜并不遥远。 黄仁勋 太阳镜现在是脸部尺寸。我能看见。 扎克伯格 那真的是一种非常有用的风格。 黄仁勋 是的,那是一个非常有帮助的人。 扎克伯格 让我成为网红达人,这样我就可以在眼镜上市之前影响它。 黄仁勋 嗯,我能看到你在尝试它。你的风格对你的影响和效果如何? 扎克伯格 现在还早。我觉得未来业务的重要组成部分是打造人们佩戴的时尚眼镜。这是我现在应该开始更加关注的事情。所以,是的,我同意。我们将不得不退役我的版本,我们每天都是同样的事情。但这也是眼镜的问题。我认为,这不像,即使是手表或手机,人们真的不想看起来都一样,对吧?所以我确实认为这是一个平台,我认为它会回到我们之前谈到的主题,成为一个开放的生态系统。因为我认为人们需要的形式因素和风格的多样性将是巨大的。并不是每个人都想戴那种眼镜,无论是谁设计的,我不认为这是可行的。 黄仁勋 我认为这是正确的。好吧,马克,我们正在经历一个整个计算堆栈正在重新发明我们对软件的看法的时代,这有点令人难以置信,安德烈称之为软件1和软件2。现在我们基本上在软件3中。现在我们的计算方式从通用计算转向这些生成神经网络处理的计算方式。我们现在可以开发的功能和应用程序在过去是不可想象的。 而这项技术,生成式AI,我不记得还有其他技术以如此快的速度影响了消费者、企业行业和科学。能够跨越所有这些不同的科学领域,从气候技术到生物技术再到物理科学,在我们遇到的每一个领域。生成式AI正处于这种根本性转变的中间。除此之外,你所谈论的,生成AI将对社会产生深远的影响。你知道,我们正在制造的产品。有一件事让我非常兴奋,之前有人问我,会有詹森AI吗?嗯,这正是你所说的创造性AI,我们只是建立自己的AI,我装载了我写的所有东西,并根据我回答问题的方式进行微调。希望随着时间的推移,使用的累积,成为很多人的一个非常好的助手和伴侣,他们只是想问问题或反弹想法。 这将是詹森的版本,正如你之前所说,这不是评判性的。你不怕被评判。所以你可以一直来和它互动。我认为这些都是非常不可思议的事情。而且,我们一直在写很多东西。仅仅给它三到四个主题,然后这些是我想写的基本主题,用我的声音写下来,并以此为起点。所以现在我们可以做很多事情。与你和我一起工作真的很棒。我知道建立一家公司不容易,你把你的公司从台式机转向移动设备,从VR到AI,所有这些设备,观看和视频多次转向真的很不寻常,我知道这有多难。这些年来,我们俩都被踢了很多次。但这就是想要成为先驱和创新所需要的。所以看着你真的很棒。 扎克伯格 同样地,如果你继续做你之前做的事情,就不确定这是否是一个转折点。但是你增加了它。这一切还有更多的章节。我认为同样的事情,看着你们走过的旅程很有趣。我们经历了这个时期,每个人都觉得,一切都会转移到这些设备上,只是会得到超级便宜的计算。你们一直在努力做这件事。就像,实际上你会想要这些可以瘫痪的大系统。我们走了另一条路。 黄仁勋 是的,我们现在不再制造越来越小的设备,而是制造计算机。 扎克伯格
|
推荐内容
- 苹果AI功能跨过“里程碑”问世!还发布了配置最强..
- 风暴前夜,本周的美国非农和通胀数据“很微妙”..
- 无惧大选后美股下跌,高盛资金流专家:我们已进入..
- 专家:新一轮债务置换规模或将达到6万亿至10万亿..
- 网红券商Robinhood进军美国大选博彩,允许用户押..
- 野村警告:市场对特朗普交易对冲过度,可能出现“..
- 美国大选前夕,比特币重返7万美元上方..
- 十月最后一个交易周,全球资产怎么看?..
- 系好安全带!未来10天,对全球市场至关重要..
- 逃亡印度的前总理,联合财阀和间谍,抢了这个国家..
- 日本政坛大地震,究竟对市场意味着什么 ?..
- “买、买、买”停不下来!A500指数基金再现提前结..
- 如何理解央行买断式逆回购
- 大选和非农领先11月决议,美联储再度进入静默期,..
- 以色列激进报复伊朗计划或因美国压力搁置,中东危..
热点阅读
- 14岁少年自杀,AI“致命对话”事件发酵!..
- 特朗普青睐的“美联储主席”人选发声:9月大幅降..
- 以色列激进报复伊朗计划或因美国压力搁置,中东危..
- 大摩:央行新政落地 A股情绪指数一周内大幅提升..
- 日本政坛大地震,究竟对市场意味着什么 ?..
- 逃亡印度的前总理,联合财阀和间谍,抢了这个国家..
- 特朗普胜选概率攀升!美国大选进入关键时刻,美股..
- 大选和非农领先11月决议,美联储再度进入静默期,..
- 如何理解央行买断式逆回购
- 美股牛市最大的敌人是——日本?
- 一天“赚”340亿美元!特斯拉股价暴涨22%,马斯克..
- “不降息”!央行缩量平价续作7000亿元MLF..
- 惠及数千万家庭!存量房贷利率如期下调,银行启动..
- 别急着押注特朗普!贝莱德:投资者低估选举陷入僵..
- 系好安全带!未来10天,对全球市场至关重要..