Medium Archive

个人文章存档 · 从 Medium 导出

超越机器:AI 版图中的创意机构

::: {#d3ba .section .section .section—body .section—first} ::: section-divider


:::

::: section-content ::: {.section-inner .sectionLayout—insetColumn}

超越机器:AI 版图中的创意机构 {#8b8a .graf .graf—h3 .graf—leading .graf—title name=“8b8a”}

原文Beyond the Machine,是设计师兼作家Frank Chimero于 2025 年 10 月 14 日在纽约布鲁克林 Kinference 大会上的演讲稿。

我已经厌倦了关于 AI 的一切。不幸的是,这是一场关于 AI 的演讲。

我正试图弄清楚,作为一名设计师,如何使用生成式 AI 而不觉得自己糟透了。它能做什么令我着迷,它产出的东西让我既印象深刻又反感,而我对它的所有者并不信任。对这一切我都深感矛盾。信徒要求奉献,批评者要求禁绝,而把 AI 只当作另一项技术,则会落得双重异端的下场。

今天,我想试着把话题打开一点。我想把这项技术框定得更像一件”乐器”,而不是将生成式 AI 视为一种智能、一种意识形态、一件工具、一副拐杖或一件武器。作为一个花了数十年打磨一套技能的人,我觉得把它当作”乐器”的框架更有吸引力。我想要一种依赖我的能力与辨识力的工作方式,而不是依赖像”品味”这样无定形且转瞬即逝的东西。(如果技术里存在”品味”,那一定是被偷运进去的。)

将 AI 视为一种乐器,会把焦点重新聚焦到实践上。乐器需要依赖技巧的表演 --- --- 号角发出声音,但你如何吹、吹什么很重要;鼓机负责打拍子并播放采样,但你采样什么、以及你在其之上如何摇摆与律动,都会成为你的个人标识。

换句话说,乐器能以它们所提供的东西给你带来惊喜,但它们并非自动化。归根结底,它们需要手感。你是”使用”工具,但你是”演奏”乐器。这是一种更为开阔的做事方式,而做这件事本身很重要,因为正是在其中你培养出通往卓越的本能。如果更好的机器不能同时造就更好的人,那么它们便毫无意义。

我相信,在如何使用并创造性地”误用”技术这件事上,艺术家比那些搞钱的人更有可借鉴之言。所以今天,我想分享四位艺术家,并希望你在离开时,能在如何与机器协作方面获得更多的灵活性 --- --- 无论是在创作工作还是其他工作中。 ::: ::: :::

::: {#ca7f .section .section .section—body} ::: section-divider


:::

::: section-content ::: {.section-inner .sectionLayout—insetColumn} 先说点背景。整个夏天,围绕 AI 的氛围似乎发生了变化。

那些关于”知识型工作将被摧毁”的咄咄逼人的预测并没有在六个月的期限内兑现。万众期待的 GPT-5 更像是在 GPT-4 基础上的小幅升级,这表明大型语言模型可能已经从”革命期”转入了”优化期”,开始权衡取舍。OpenAI 借着 Jony Ive 的消息鼓励大家去幻想硬件,这一点让我觉得,软件端可能没有足够的上升空间来支撑他们所需要的利润。与此同时,小型的本地模型在令人惊讶的众多用例中已经”够用”,而且更便宜、更私密、更节能。

进展放缓,预测被收回,科学开始显得更加朦胧。我们也许还没到 AI 的寒冬,但我希望迎来一个 AI 的秋天。秋天很棒;空气变凉,夏日的狂热消散,万物放慢脚步。此刻,AI 的变化看起来足够增量化,足以开始铺设策略。这意味着我们可以以更稳健的立场思考自己的方法,而不是随着炒作而摇摆 --- --- 无论那炒作来自上而下(“末日准备论”型 CEO 们在 LinkedIn 上的帖子),还是自下而上(X 上的”拼命奋斗派”)。

炒作是意料之中的 --- --- 新技术靠投机运转。你能感受到过去 30 年一轮又一轮繁荣的残留物。人们有一种感觉:他们错过了在互联网、电子商务、应用商店、社交媒体、加密货币、迷因股、英伟达上致富的机会。泡沫之所以被吹大,是因为个人不想错过下一次意外横财,而公司也不想在任何萌芽的技术变迁中被取代。科技史逐渐钙化为关于戏剧性胜利与意外败落的故事,而结果就是一种几乎强制参与”预测”的科技文化,而非创造价值或满足需求。

美剧《火线》中有一句话,谈的是人们在更传统机构内如何规避失败风险:“如果你不下场,你就不会输。“(You can’t lose if you don’t play)在科技世界,这个逻辑正好相反。与其不参与下一次创新而失去机会相比,陷入集体性谬误的代价更小,所以规则变成了:“只有不下场,你才会输。“(You only lose if you don’t play.

换句话说,推动人们加入 AI 热潮的动因,是一种感觉:这是当下城里唯一的一场游戏,而且别人都已经在玩了。炒作声更响,泡沫更大。 ::: ::: :::

::: {#4a6c .section .section .section—body} ::: section-divider


:::

::: section-content ::: {.section-inner .sectionLayout—insetColumn} 真正让我吃惊的并不是 AI 的炒作,而是随之而来的缺乏团结。面对”AI 将取代劳动力”的叙事,我们作为技术从业者的第一反应并不是彼此保护,而是寻找用这些工具来取代合作者的方式。

裂痕恰好沿着学科分野出现:工程师用 AI 来幻想”免去”设计师,设计师幻想”免去”工程师,产品经理则希望两者都”免去”。在这种氛围里,AI 变成了”亦敌亦友识别技术”,成了避免共同合作的另一种方式。抓起一件工具绕开繁琐的协作总是更容易,即使这意味着要做得更多、而且要独自去做。AI 降低了跨越自己职责边界工作的门槛,这当然可能带来学科间更多的重叠,但此刻我们更多是在把彼此挡在外面,或者互相踩脚趾。

在协作已然紧绷的情况下,我们退回到个体努力也就不足为奇了。但与整体脱节、又被自动化加速的个人工作,只会让动荡更糟、纠偏更剧烈。更深层的问题在于,公司仍未想明白如何规模化提供”方向感”,于是员工在系统的速度与规模之下被来回折腾。

当协调失灵时,“自给自足”的幻想便迅速填补空白。毕竟,GenAI 从一开始就被打造为一种”个人化”的技术:不论是”一对一聊天”、一个人创业的幻想,还是被设置成对你阿谀奉承的助理。它在说:“只要把事做了,不需要任何技能。”

你所需要的只是一个提示词、一个梦想和一些感觉。当然,我们也确实选择了某个个人作为这一切的门面。 ::: ::: :::

::: {#5c9f .section .section .section—body} ::: section-divider


:::

::: section-content ::: {.section-inner .sectionLayout—insetColumn}

“金钱无处不在,诗歌也无处不在。我们所缺少的是诗人。” --- --- Federico Fellini

Vibe coding 有一个吉祥物,它就是音乐制作人 Rick Rubin。在回到 vibe coding 之前,先简单介绍一下他的背景。

Rubin 以 Def Jam Records 的联合创始人身份踏入音乐行业。他通过为 LL Cool J、Run-D.M.C. 和 Beastie Boys 制作唱片,帮助嘻哈音乐走向主流。之后,Rubin 为 Jay-Z、Johnny Cash、Red Hot Chili Peppers 以及许多其他艺人跨风格制作专辑。他被认为在从未学习演奏任何乐器的情况下,塑造了过去四十年的声音风貌。在采访中,Rubin 坦然面对这种反讽:他不会操作调音台,不会做工程师的活儿,也并不真的会弹吉他。

Rubin 所谓缺乏技术能力,使他轻而易举地成为”vibe coding”的招牌人物 --- --- 这种观念认为,只要具备合适的感受力再加上一些提示词(prompt),就能在完全不会使用这些工具的情况下引导技术产出。

Anthropic 也顺势推出了 The Way of Code 项目,在其中,Rubin 将中国古代哲学典籍《道德经》改写为关于 vibe coding 的文本。

这是一场营销噱头,但我将其解读为一种主张:通往启蒙之路正在远离能力,转而走向氛围。

以下是网站上的其中一章:

《代码之道》#47*
不出门,
你也可以知晓整个世界。
不透过窗户,
你也可以看到天道之途。
你走得越远,知道得越少。
你知道得越多,理解得越少。
因此,Vibe Coder
不去而知,不看而见,
并成就一切
*而无需做任何事。

呃。

我第一次看到这个时,心想:“有人读过这个吗?“每当遇到你觉得糟透了的东西时,这总是会冒出来的问题。但在 AI 时代,我发现自己还会追问一句:“有人写过这个吗?”

这是个复杂的结。艺术之所以有趣,部分在于某个人把精力投入到做出这件作品,而不是他们本可以做出的所有其他东西。但艺术家也知道,最好的点子会以完整的面貌出现,仿佛它们是自己生成的。努力并不是让作品有意义的原因,然而不加改动地发布 AI 的产出,仍让人感觉有点小小的冒犯。

我以为他们用 AI 来写修订版的《道德经》章节,因为这些诗句旁边配着一些以 vibe coding 制作的视觉效果。但在采访中,Rubin 说这些是他亲自写的。宽容一点说,我只能把它当作一个对我来说并不奏效的玩笑。

像大多数以迷因方式传播的想法一样,“vibe coding”被带得太远了。Karpathy 的最初帖子其实很克制:对工程师而言,一个有趣的小 hack,而且”用在周末那种一次性项目上也不算太差”。轻量、边界明确、可抛弃的工作,非常适合原型制作、实验、脚本编写和个人软件。如果范围只是这些,我完全赞成 --- --- giddyup!

但一旦这个词流行起来,人们就开始把它应用到各处,把一个小窍门拉伸成一种足以被塞进古代典籍的哲学。

和许多与 AI 有关的事一样,它让人感觉完全失了分寸。也许这正是它的幽默所在。但在这个过程中,Rick Rubin 被捧作”不需要技能”的证据。仿佛道家核心的”无为”(wu wei,不强为的原则)被掏空并重铸为依赖:用机器,不需要任何技能或知识。

Rubin 显然拥有技能和知识,但我们得到的是两个 Rick Rubin。其一是录音室里的那位,不会弹吉他,却擅长引导艺人并澄清他们的诉求。其二则是漫画化的Rubin ,在访谈中刻意强调自己的无能,写拙劣的诗,摆出导师的架势。也许这种分裂正是当作品与执行脱节得过于抽象时会发生的事。

近来,我一直把自己对 AI 的使用当作一种空间关系来思考。我与机器的相对位置在哪里 --- --- 在它之上、在它身旁、还是在它之下?每一种位置都对应着不同的权力关系。在上是掌舵,在旁是协作,在下是服务。

在Rubin 式的 vibe 安排中,你处在机器之下并依赖于它。没有技能,模型的边界就成了你的边界,你与任何在文本框里输入愿望的人并无二致。不加质疑地接受 AI 给你的东西,你并非在生产,而是在消费。这种被动最终会被用来反制你。我们以前就见过:流媒体服务把艺术压平为算法的平均值与背景噪音;新闻信息流把注意力重接线到愤怒上,因为”互动”意味着增长。每一次,机器都以个性化定制吸引我们,同时悄然掌控了规则。如果把 AI 用于被动消费,同样的事还会发生 --- --- 哪怕这种消费被包装成”执行”。

所以,尽管 vibe coding 也许对短期工作有用,但对于任何你希望其寿命超过一盒酸奶的东西,它都不是合适的方法。省下的时间并不等于获得的实力,因此我去寻找与机器协作的其他范例。 ::: ::: :::

::: {#9c28 .section .section .section—body} ::: section-divider


:::

::: section-content ::: {.section-inner .sectionLayout—insetColumn}

“看着一个人精力充沛地制作一口漂亮的棺材,可能会让人振奋。而看着某人草草了事、漫不经心地做出史上最糟糕的生日蛋糕,则会让人沮丧。” --- --- George Saunders

过去几个月里,我一直在深入研究 Brian Eno 的作品与音乐。

Eno 在 70 年代早期以 Roxy Music 乐队的键盘手身份起步,帮助合成器在流行音乐中的普及。随后他开始个人发展,并在后来以制作人的身份为过去五十年里一些最重要的乐队建立起事业 --- --- David Bowie、Devo、Talking Heads、U2,而在更近一些的时期还与 Fred Again 合作。

Eno 很少是那种炫技的演奏大师;相反,他是合作者、是系统型思考者、是把录音室变成实验室的人。对我而言,使 Eno 尤其相关的,是他在歌曲之外的工作。他作为艺术家的影响,大多体现在开创新的形式、提供新的词汇,并营造整体氛围。

在 70 年代末,Eno 为 ambient music 命名,并通过创作适用于特定目的与场所的作品,改变了我们对录制音乐作用的看法。音乐为机场而作、为行走而作、为思考而作。上方是 Tero Parviainen 在浏览器中复现的 Eno《Music for Airports》第 2 轨。

他的音乐并非预先编排的作品,而是漂移与呼吸,由不同长度的重叠循环构成,这些循环彼此时而同步、时而错位,产生他也无法完全预测的缓慢变化。

Eno 称其为”一条声音之河”(a river of sound),总是相同,又从不相同。从这个意义上说,ambient music 是他后来称为生成艺术的第一次实验:在精心设定的约束之内生长与变化的系统。

自 80 年代以来,Eno 一直对使用软件与系统来生成音乐和视觉艺术抱有兴趣。在过去十年里,他把这一理念带到手机上,推出用于音乐创作的生成式应用。

  • [Bloom 让你通过点击会向外泛起涟漪的点来播种旋律。]{#dc43}
  • [Scape 让你把抽象元素放进一幅画面式的景观中,从而创造出声音的风景]{#160b}
  • [而 Reflection 则通过发布允许无尽音乐的生成式软件,消解了一张 Brian Eno 专辑的边界。]{#df24}

我认为,如果你在寻找一位音乐制作人来为如何与机器协作提供灵感,那么向 Brian Eno 而非 Rick Rubin 寻求,会更有可能获得启发与更多可供思考的点子。对我来说,差异归结为”站位”。

如果说以 Rubin 的方式工作会把你置于机器之下,那么 Eno 则与它并肩而行。他用自己的输入和采样搭建一个系统,然后倾听、选择,并持续塑形。Eno 常说,在创作音乐时他感觉自己像个园丁:种下循环与质感,然后看着它们发芽成一些出乎意料的东西,只要稍加照料与修剪,就有可能变得极其美丽。机器或许能产出素材,但将其塑造成有意义之物的工作仍然落在他身上。这是把创造力当作一种”栽培”。

机器输出的价值取决于我们如何看待它,而我们的解读往往与其技术上的完美关系不大。来自 GenAI 的完美、炫技式输出可能显得毫无生气,而某些粗糙或破碎的东西却可能自带趣味。这就是我喜欢写糟糕且相互矛盾的提示词的原因,因为它们似乎更符合这些模型实际运作的方式。模型并非确定性的;我们并不完全理解它们的联想如何形成,或为何某些模式会出现。那么,何不让它们漂入暧昧之境,看看会发生什么?我不希望在我的银行应用里使用一个不稳定的 AI,但在创意工作流中,“幻觉”本身就像是一切的要义。

在某种意义上,早在我们有这个词之前,Brian Eno 就已经在摆弄”提示词”了。1975 年,他与 Peter Schmidt 一起创作了 Oblique Strategies,这是一副旨在把艺术家从习惯中摇醒的卡片。每张卡片上都有一条简短的语句,供人解读并遵循:“尊重你的错误,将其视为隐藏的意图。""使用一个旧想法。""以不同的速度工作。“这些与其说是指令,不如说是挑衅 --- --- 些许重新框定,打开空间,让意料之外之物浮现。

对我来说,这更像是在创意工作中进行提示的更佳范式,无论第一步的执行属于人还是机器。一个好的提示并不需要像蓝图那样运作。它们也可以像星座运势或签文那样发挥作用。

模棱两可的提示所带来的结果可能古怪、非逻辑、却又极具刺激性,因为系统并不害怕犯错。好东西就在技术的边缘,即便它有点糟。Eno 在 1995 年把这点说得很优美:

“无论你在一种新媒介中发现什么奇怪、丑陋、不舒服、令人作呕的东西,它们必将成为该媒介的标志。CD 的失真、数字视频的抖动、8 位音频的糟糕音质 --- --- 一旦这些缺陷能够被避免,它们就都会被珍视并被效仿。“(Whatever you find weird, ugly, uncomfortable, and nasty about a new medium will surely become its signature. CD distortion, the jitteriness of digital video, the crap sound of 8-bit, all of these will be cherished and emulated as soon as they can be avoided.)

时间证明他是对的。这个观点可以解释黑胶唱片的回潮、iPod 的复兴、Z 世代用老式数码摄像机拍派对,或者为什么 8 毫米胶片对婴儿潮一代充满怀旧意味,正如第一代 iPhone 上那些过曝的照片会让我们千禧一代感到依恋。如果让我猜测,我们会怀念现代大语言模型中那种词语尴尬地涓滴式出现的方式。

换句话说,每一项新技术都承诺更清晰,但它的本质却由它产生的噪声所决定。限制所带来的摩擦赋予技术以性格,所以当一个系统变得过于顺滑、过于包罗万象或过于迎合时,它就不再具有任何”签名式”的辨识度。以下是 Eno 在今年早些时候的表述:

“就我对用 AI 程序创作音乐的浅浅接触所见,你几乎把所有时间都花在设法阻止系统变得让人麻木的平庸上。你真的能感受到 AI 的平均化效应在牵引你,因为你所接收的是一种从许多不同来源平均化提炼出来的东西。”

一封普通的电子邮件或一行普通的代码没问题。普通的艺术却不行。要用 AI 让作品活起来,我们必须通过与它并肩工作来抵抗那股把一切拉向平均值的牵引,塑造它给出的东西,并倾听其中的缺失。有时所需要的,是一两次经典的老派错误。

另一种答案不是去栽培机器的输出,而是通过它来创作,把模型当作材料,选择输入并塑造规则。换句话说,不是与机器并肩工作,而是走进机器之中。 ::: ::: :::

::: {#a5e5 .section .section .section—body} ::: section-divider


:::

::: section-content ::: {.section-inner .sectionLayout—insetColumn}

“到了二十世纪末,我们的时代,一个神话般的时代,我们都是嵌合体,是被理论化并被制造出来的机器与有机体的杂交体。” --- --- Donna Haraway

如果 Brian Eno 向我们展示了与机器并肩工作并栽培其产出的意义,那么 Holly Herndon 和 Mat Dryhurst 则向我们展示了走进机器内部意味着什么。

Herndon 和 Dryhurst 是视觉艺术家兼音乐人,十多年来一直与 AI 协作,把数字系统当作重新思考音乐本身的”乐器”。他们构建工具并训练模型,展示了 AI 能为创作实践提供什么 --- --- 作为一种对艺术家的整合、延展与放大的手段。

以 2019 年的《Proto》为例,他们开发了一个名为 Spawn 的 AI “婴儿”。他们通过与歌手进行呼唤 --- 回应的现场表演来训练它,随后在同名专辑中将该模型作为一件人声乐器使用。

他们创立了 Spawning,称其为 AI 的”同意层”,让艺术家可以决定是否选择加入或退出模型训练。与此同时,他们推出了 Public Diffusion 的测试版 --- --- 一个完全以 3000 万张公有领域图像训练的基础模型,旨在使生成式创作在版权方面更为安全。

还有 2024 年的 xhairymutantx,在惠特尼双年展上展出;他们用 Holly 的照片训练了一个文生图模型,然后向公众开放,邀请他人使用它进行创作,并探索身份如何在生成式系统中被扭曲与延展。

最近,他们推出了 The Call,这是一个涉及全英国合唱团的合唱 AI 项目,在其中,录制的人声成为共享数据集,而由此产生的模型被整合进一个空间音频装置,演绎生成式的合唱编曲。Serpentine Gallery 作为数据信托的管理方来规范使用,确保参与的合唱团获得报酬,并对其声音的使用方式拥有自主权。

这些作品的灵感来自中世纪音乐、文艺复兴音乐和圣歌。人声演出由合唱数据与 Holly 本人的歌曲数据相结合而成。我们来听一小会儿:

当你接触到 Herndon 和 Dryhurst 的作品时,你会注意到,他们对服务艺术家所需的管理结构的关切,与他们对新技术创造潜能的关切同样强烈。他们说,一切媒介都是训练数据,因此他们的工作直面”大规模媒介生成对艺术家意味着什么”的影响。AI 模型与经济模型不必打包在一起。两者都可以成为创新的领域,而切断二者之间的隐含关联,或许是实现伦理化 AI 的必要前提。

这种方法产出的不仅仅是艺术本身,更是对使艺术成为可能之条件的重新想象。当系统被设计为尊重艺术家时,规模就会成为工具,而不是威胁。这也开启了新的问题:在那样的规模下,会出现哪些新形式?故事可以被重新思考;与其由更少的人创作同样的数量,不如让同样多的人创作更怪异、更丰沛、更相互关联的作品,如何?

随着工具演进,我们用来理解它们的隐喻也必须更新。Herndon 和 Dryhurst 将下一个阶段描述为从 sampling 转向 spawning。Sampling 是 20 世纪的逻辑。你从一张唱片里取一段 --- --- 一段 James Brown 的 breakbeat、从一张爵士乐 LP 里抽取的一记 horn stab --- --- 然后把它融入一首新曲目。它具有变革性,但你知道来源,也能追溯脉络。

Spawning 与之不同。你不是提取片段,而是用一位艺术家的全部作品来训练一个模型,然后以他们的风格生成新素材。传承清晰,起源模糊。Sampling 处理的是”引用”,Spawning 则触及 DNA。这个区别很重要,因为 Spawning 以 Sampling 从未有过的方式把赌注抬高了。当你的作品用来训练一个模型,被取走的不是一个音符或一段节拍,而是你的感受力与创作视角。

Sampling 引发了关于所有权与署名的争论;Spawning 则重置了游戏规则。互联网通过对完美拷贝的无限分发挑战了版权。有了 AI,当”无限分发”与”无限模仿”对接时,会发生什么? ::: ::: :::

::: {#ffa7 .section .section .section—body .section—last} ::: section-divider


:::

::: section-content ::: {.section-inner .sectionLayout—insetColumn}

你是如此美好*
好得令人难以置信
你让我、让我
让我渴望着你
*《Why Can’t I Be You?》 --- --- The Cure

我用一家 AI 公司的不合时宜的营销时刻作为这场演讲的开头,所以用另一个这样的例子来收尾也算恰当。去年三月,OpenAI 在 ChatGPT 中上线了图像生成功能,并鼓励人们上传自拍,把自己变成动漫角色。

结果一目了然:宫崎骏与吉卜力工作室式的柔和光线、圆脸,以及水彩般的天空。数小时内,社交媒体便被”吉卜力化”的图像所淹没 --- --- 甜美、怪异、甚至诡谲。

这种反讽直击人心。宫崎骏的电影是手工动画。每部电影需要超过 150,000 张绘图,而如今,他的工作室风格却被用来推销那些他毕生反对的捷径与自动化。模型把宫崎骏的作品与其他一切一并吞下,于是当需要时,OpenAI 就可以像操纵木偶一样摆弄他的风格。去年,他们拿斯嘉丽·约翰逊的声音来推广文本转语音。明年,他们还会再找一位新的艺术家。

关于那个刷屏时刻,如今已经说得够多了,因此我不想继续停留在风格层面的讨论。我想重视宫崎骏的艺术,并思考他电影的内涵。

作为收尾,我想看看《千与千寻》 --- --- 一部与身份与模仿、欲望与满足纠缠的电影。当然,把过多的寓意读入艺术作品总是有风险的,但在打动我们的事物中寻求智慧似乎是合理的。

《千与千寻》以一次跨越开始。穿行乡间时,10 岁女孩千寻(Chihiro)与父母经过了一座鸟居,这是一种用于标示寺庙的标志。

他们停车,漫步进入一个看起来像废弃游乐园的地方。千寻和她的父母尚未意识到,他们方才经过的那座鸟居标记着一道门槛。他们已经进入了灵界。

当他们发现一个无人看管的食摊时,她的父母便坐下吃了起来,并承诺稍后付款。但这些食物并不出售;它们是为神明准备的供品。他们拿走了不属于他们的东西,也因此,千寻的父母没能通过道德考验。

作为惩罚,他们被变成了猪。与 AI 的类比不难看出:未经同意地”吞食”,无节制的欲望摧毁了对所被消费之物无形层面的任何觉察,等等。

为了救父母,千寻被告知去附近的澡堂打工。那里是一个由享乐与欲望驱动的贪婪之地;各方面都奢华浮夸。它由汤婆婆管理,这位女巫通过窃取工人的名字来将他们束缚于劳役。

千寻被改名为”千”,并得知如果她将自己的真名彻底遗忘,她将永远找不到回家的路。教训很明确:在由欲望主宰的地方,一切都可以被吞噬,甚至包括你是谁。模型也有类似的模式:一旦它们”吃掉”你的作品,就会抹去你的名字,以便将你的劳动用于它们自己的目的。

影片后来再次回到”饥饿”,这一次是在精神层面。千寻在雨中遇见了无脸男,一个静静地等待在澡堂外的灵体。出于善意,她让他进来避雨,却没有意识到自己引进了什么。无脸男是拟态的化身。进入澡堂后,他观察并吸纳那里的价值观。他试图用各种方式回报千寻让他进来,但她拒绝了他的馈赠。当晚稍晚的时候,一只在澡堂工作的贪婪青蛙悄悄溜回大浴池,想看看是否有另一位顾客遗落了金子。寻找之际,他碰上了无脸男。无脸男看出青蛙想要黄金,便从手中变出金子引他靠近。青蛙被迷住,向前靠近。他着了迷。青蛙越走越近,无脸男将他吞下。他现在能用青蛙的声音说话了,因为吞食使他能够模仿并发号施令。但无脸男仍旧饥饿。又有一名员工听到动静走了过来。无脸男用青蛙的声音向下一位员工下达命令。他说他饿了。把所有人都叫醒。到吃饭的时候了。于是他变出更多的金子,得到更多的食物,他的食欲继续升级。

相似之处不难看出来,对吧?一种永不满足的力量,不断吞食以便模仿,用巨额金钱挑动行动?无脸男的饥饿与澡堂的贪婪勾连在一起。消息传开:有位富客到来,于是全场为招待他而陷入疯狂。厨子们端着热气腾腾的托盘在走廊中游行,仆人们又唱又跳以博取他的注意,连汤婆婆最终也注意到了。所有人都想从无脸男那里分一杯羹,但再多的食物与奉承也无法满足他。无脸男想要的是见到千寻。他不断试图给她东西,这一点颇为辛酸,因为他学到的是这样做能获得别人的注意。但千寻始终拒绝,这既令他沮丧,也加深了他对她的执念。无脸男的吞食最终达到顶点。他又吃了两名员工,把场子搅得一团糟,于是千寻被迫直面他。无脸男不明白,自己真正寻求的 --- --- 真正的连接 --- --- 既买不到,也吃不来。他把精神层面的饥饿误当成了肉体的饥饿,试图用食物去填补一种食物无法满足的空虚。当千寻最后一次拒绝无脸男的馈赠时,她提出把自己献出来让他吃。但在此之前,她要无脸男把她一直留着、用于让父母恢复原状的药吃下去。无脸男把它吃了,仅仅因为他什么都吃。突然,澡堂的迷醉开始破裂。澡堂的工人终于看出他的金子是假的,无脸男把他吃过的所有人都吐了出来,很快又变回沉默、影子般的瘦削形态。

我想,这个教训是:对于你并不需要的东西,你永远也得不到足够。在离开澡堂的路上,千寻看到无脸男被打回原形。她意识到他需要的是连接,于是离开时允许他跟在自己身后。无脸男同千寻一起乘上火车,去沼泽地见汤婆婆温和的孪生姐妹钱婆婆。钱婆婆与汤婆婆截然相反。温暖、不张扬。在钱婆婆的小屋里,某种变化发生了。敲门后,无脸男在门口犹豫不前,但她把门敞开,让他进来。这一次,他是被邀请进入的。在那里,无脸男得到了某种终于令他满足的东西。因为有了一个朴素而可归属的去处、无需表演丰盛,他现在可以正常地进食了。无脸男终于在钱婆婆身旁纺线而得安宁,把注意力转向细小而稳定的工作,为一次协作准备材料。

关于 AI 的教训或许类似。它的危险在于,它运行在一个没有”够了”概念的系统之中。AI 需要边界,我们也需要。问题不只是”这台机器能做什么?“,而是”它该服务于什么?“,更重要的是,“我们应该何时停止?”

听着,我并不天真。我知道在这些系统内部可供行动的空间有多狭小。现在是 2025 年,而我已经疲惫不堪。我不相信这样的言语会带来多大改变。那些有能力改变现状的人并没有在倾听,而维持机器运转的激励又强大得可怕。

所以我去寻找一些更小的东西:渐进式的进步、意外的收益、小幅重定向、细小的拒绝。我不确定该如何看待这一切,这也是为什么我试图在困惑中把话说清楚。我想在这一切发生之中为自己凿出一块小小的创作空间。这可能吗?

我心中的乐观者记得千寻,这个用自己的拒绝把那吞噬一切的灵体打回原形的女孩。我心中的实用主义者记得宫崎骏,这位创造了她的艺术家,仍被他试图抗拒的机器所缠绕。我心中的现实主义者知道,我在他们身上看到的一切,其实都源自我自身。

我随身带着哲学家与作家 Simone Weil 的一句话。她说:

“我们必须忍受想象与事实之间的不协调。与其说’这片风景很丑’,不如说’我正在受苦’。“(We have to endure the discordance between imagination and fact. It is better to say, ‘I am suffering,’ than to say, ‘This landscape is ugly.’) --- --- Simone Weil

换句话说,最好留在你自身的体验之中,而不是把它投射到外界。

《千与千寻》于 2001 年上映。它与 AI 毫无关系。若我在不同的时刻做这场演讲,无脸男可以指代加密货币,可以指代谷歌,可以指代社交媒体。寓言有其界限。Simone Weil 也许会说,这些解读的共同点在于:我是那个在进行解读的人。

我曾经喜欢技术。它让我挫败的唯一原因,是我在内心深处相信它能够满足我。或许它曾经做到过,但机器并不够。这是技术的失败,还是我自身的成长?有更值得为之受苦的事物。

或许写下这些,是我版的”在钱婆婆的小屋里找到一件小工作可做”。纺车转动着,我在纸上又写下几行。然后我想:“这台机器也许无所不知,但至少我知道何时该停下。”

这听起来像是出自《道德经》。这又把我带回Rubin的改写。我先前不公平。他写下的诗句并非全都糟糕。若你细看,在那一摞中段有这样一段:

《代码之道》#53
大道是容易的,
然而人们却寻找捷径。
注意当平衡失去之时:
当富有的投机者兴旺发达
而农民却失去土地。
当精英阶层强加规章
而劳动者无处求助。
当政客为虚构的灾难性事件
资助虚假的补救方案。
这一切都是傲慢与腐败。
这与自然之道并不相符。

我又在想:有人读过这个吗? ::: ::: :::

← 返回文章列表