提交中
📝正在回复 #98845
qotZyyxL (肥适之) 2022-03-21 00:29:16
杂七杂八,什么都有可能
新建仓库2
🀄 34
👍 6
💗 3
🎉 1
dmdzleIe 2025-02-09 21:55:02
卡琳·伍尔夫:你是一位英语系教授,长期研究写作、阅读与技术之间的关系。在你看来,大型语言模型驱动的文本与其他阅读和写作技术的变革——比如活字印刷或廉价报刊的革命相比,应该如何理解?

马修·科申鲍姆:一方面,我反对泛泛的类比,比如“哦,这就像古腾堡革命一样”。但眼下这个时刻确实显得异常激烈。我姑且称之为“人工智能产业”的发展速度,确实让人惊叹。这不仅关乎我们现在所处的位置,也关乎未来六个月、十八个月、五年后的走向。

我想以一种更具体的方式来讨论这个问题,那就是思考“文本”到底是什么。在我的职业生涯中,“text”(文本)已经演变成了一个动词——我们现在可以“text”某人(发短信)。这是一个新的词汇,但它也反映了我们与文本的关系如何发生变化——文本不仅仅是一个静态的对象,它还是一种动态的行动方式。

由此延伸,我们可以进一步将文本视为一种数据形式。这里所说的“文本”并不仅仅是“.txt”格式的文本文件,而是一种数据类型(data type),使其可以被交换、转换,并且受到算法的操控。正因如此,大型语言模型在数学层面上执行的操作才得以成行——文本这一类人类表达形式已被业务化(operationalized),成为计算机可以输入、处理并输出的数据类型。

我认为,这不仅仅是算法和大型语言模型的问题,同时也关乎网络的政治经济学。在这种框架下,文本是一种“内容”(content)。将内容视为可交换的媒介——无论是文本、病毒式传播的图片还是视频,这一概念相对较新。

威廉·萨菲尔(William Safire,1929-2009)是最早注意到这一趋势的人。他指出,90年代末,互联网产业的人们突然开始广泛使用“内容”一词,以替代作家、艺术家和各种创意工作者创造的东西。因此,文本不仅是一种数据类型,同时也是一种内容形态。这赋予了文本某种商品价值,而这正是语言模型介入的地方。基于运作方式,大型语言模型将加速并放大文本作为“内容”的商品价值,而之所以能做到这一点,正是因为文本已被业务化,使其能够被自动操控和处理。
dmdzleIe 2025-02-09 21:55:49
卡琳·伍尔夫:你的一个核心观点是,读者的辨别能力将因为所谓“灰色粘质”(gray-goo)式的无限文本生成而发生巨大变化甚至被削弱。你认为这里存在某种本质上的区别吗?还是说仅仅是“规模”的问题?抑或正是“本质+规模”的结合,使得这一现象变得如此可怕?

马修·科申鲍姆:我认为两者兼而有之。首先是规模,绝对是规模问题。这些模型已经具备的输出能力,未来可能达到的输出能力也很可观,正在形成一种“文本末世”(textpocalypse)式的场景,是一场文本与内容的海啸。

其次是个性化和定制化。所谓“灰色粘质”不仅仅是数量庞大的文本泛滥,它还会以个性化的方式呈现。我们阅读机器生成的文本,但与此同时,机器也在“阅读”我们。这种现象在网络上已经随处可见,例如个性化广告等。而未来,你会开始看到网站的内容会根据个体用户的画像被实时改写。

如今,网络上的各种常规监控、所有关于你个人的数据收集都将被输入到一个量身定制的语言模型中,使其能够迎合任何人的偏好。这对我来说,似乎真的是“太阳底下的新鲜事”。
dmdzleIe 2025-02-09 21:56:26
卡琳·伍尔夫:对于我们的读者来说,辨别能力当然与文本的权威性以及基于证据的研究成果密切相关。你能谈谈文本权威性如何在漫长的时间跨度中发生了变化?我们将如何知道自己正在阅读的是人类创作的文本,还是机器生成的文本?

马修·科申鲍姆:我给你一个会引发争议的答案:十年后,我们既分不清,也不会太在意。

“文本末世”有一种极端情况,那就是整个网络被机器人发布的海量文本淹没了。但也有一种更温和的情况,人工智能将悄无声息地深度渗透进我们日常的写作习惯。这已经在发生了。人工智能的工具正被直接集成到文字处理软件和其他生产力工具中。

这正是“文字处理的技术史”重新变得重要的原因。我们已经从最基础的拼写检查,发展到了语法检查,再到预测文本。而生成式人工智能在某种程度上只是“超级强化版的预测文本”,它将以同样的方式占据主流。从某种意义上说,区分“人类创作的文本”或“机器创作的文本”将不再具有实际意义。

未来,我们写作大多数文本都会是一种“混合体”。在最理想的情况下,真正的思考者依然坐在键盘前,但他们将生成式人工智能视为另一种文字处理工具,与其输出内容互动,调整、修订,并将其融入自己的语言风格中,使之成为个人表达的一部分。
dmdzleIe 2025-02-09 21:57:06
卡琳·伍尔夫:“文本末世”是否会让我们重新回归手写、手递的信件权威?是否会出现“慢文本”运动,就像“慢食运动”一样?

马修·科申鲍姆:我的另一个身份是一名活字印刷工,还开设了一门名为“书籍实验室”(Book Lab)的课程,学生们非常喜欢它。我不确定他们是否会用“慢文本”这样的词来形容自己的体验,但我认为,他们回应的正是我们可以称之为“匠心制作”和“慢阅读、慢创作”的东西。

在课程中,他们用双手实际操作,甚至会弄脏自己的手。这是一种触觉上的体验,是一种合作性、社交性的实践。我相信,这种形式会有它的一席之地。但我不会将它想象成(大写的)“文学”的未来,因为那听起来未免过于小资情调。

从某种意义上来说,这种趋势已经存在,比如独立出版、小型出版社,甚至活字印刷本身,它仍然是一种活生生的传统。但我确实认为,我们会看到更多这样的现象,甚至会有一些作家或出版商刻意将自己的作品品牌化,强调“100%纯人类创作”——就像有机食品一样。所以,是的,我们会迎来“农场到餐桌”式的文学。
dmdzleIe 2025-02-09 21:57:59
卡琳·伍尔夫:你认为人文学科的视角能帮助我们应对这些问题,至少提供一种批判性的立场,尤其是针对这一问题?

马修·科申鲍姆:我认为可以。而且我必须这样认为,因为另一种选择就是彻底的抵制。但我认为,我们仍然有很大的空间来批判这些新技术,这正是人文学科的一部分使命。不过我也认为,如果我们唯一的立场是抵制,那或许是一种存在主义层面的错误。

这些工具不仅是对文本的影响,还有对图像和其他媒介的影响。当我们看到这些工具的运作方式时,它们展现出了一种巨大的创造力、表现力和想象力的喷涌。如果你去Discord上观看Midjourney的作品,你根本跟不上更新的速度,信息流不停刷新,就像一个计算机模型生成的万花筒。没有人确切知道这些图像的来源,但我们知道,有许多艺术家的作品被爬取、被模型吸收,而他们却没有获得应有的报酬。这些问题都是真实存在的。但至少对我来说,面对这一切,很难不感到一丝兴奋,也很难不想去探索如何在创意层面上加以利用,以一种负责任的方式参与其中,而不是以剥削的方式。

相比之下,文本或许比图像更难处理。图像生成器就像点唱机,你按下按钮,就会出现随机的视觉效果。文本是一种基于时间的媒介,它需要时间来创作,也需要时间来阅读。因此,人工智能诗歌或人工智能叙事的实践,可能需要更长的时间去打磨、完善和精炼。它不会像图像生成器那样立即获得大众的青睐。

在马里兰大学,我们正在启动一个“数字叙事与诗学”(Digital Storytelling and Poetics)的辅修项目,这个项目的核心理念就是,我们最应该教给学生的,不是如何回避或抵制这些技术,而是如何以创造性和负责任的方式与它们互动。对我来说,这种方式与批判和抵抗同样重要,甚至可能更重要。
dmdzleIe 2025-02-12 20:55:54
翻了一下《流俗地》,哇开头这个气质就好合我口味( ゚∀゚)

大辉回来了。这种事,怪不怪呢?光天化日,一个死人,活生生出现在大街上。

这不是普通的大街。五兵路是锡都的主干大道,一路上景点特多。锡都是个山城,路的南端重峦叠巘,岩壁耸立,壁上许多山洞像被史前巨大的白蚁蛀空作巢,无尽纵深,都被开辟成石窟寺。三宝洞南天洞灵仙岩观音洞,栉比鳞次,各路神仙像是占山为王,一窟窿一庙宇,里头都像神只住的城寨,挤着满天神佛。大辉就出现在南天洞外头的停车场上。彼时正午,日头高挂,像一盏大灯在严酷拷问天下苍生。

那可是南天洞啊,山老洞深,亿万年的日月精华了,那庙据说也是百年老庙。洞里由太上老君坐镇,再沿着洞壁一路布置,让玉皇大帝西皇祖母协天大帝观音佛祖财帛星君吕祖先师关圣帝君和大伯公虎爷公等等等等,七十二家房客似的各居其所;肩挨肩,各抱香炉,排排坐食果果。

这个九月,说来事多怪异。主要是这个月公众假日特别多,便让人感觉它特别漫长。月初还正逢阴历七月半,中元节要来;地官赦罪,阴曹门开,万千孤魂饿鬼待施,大辉若真是个死人,会在这时节出现,倒也不奇怪,但他是阴魂呢,怎么可能在这阳火最盛的时辰出现在这种地方?
是否立即朝美国发射核弹?
为 #654 送出表情
上下滚动,选择表情
👍 赞!
👎 这不好
😆 欢乐
🎉 烟花
😕 嗯...
💗 爱心
🐱 喵喵喵
🐭 鼠鼠我呀
🐔
🐷 猪头
🐶 我是狗?
冲刺!冲!
😱 吓死了
👀 就看看
🤡 小丑
🀄 太中咧!
🤣 笑哭
😅 这...
😫 痛苦面具
😭 我哭死
😋 我吃吃吃
🦪 牡蛎哟牡蛎
🈁 ko↓ko↑
🤔 嗯?
🤤 发癫
🥺 求你了
😡
耶!
🦸 你是英雄
🍾 开香槟咯
🌿
送出该表情需要消耗 20 积分