Gemini写小说被解剖：AI叙事与人类差在哪？

admin AI新闻 2026-06-24 1

你提供的内容并非一个完整的句子呀, 请你提供具体的句子等内容以便我进行改写。

一场“文学解剖”实验

2026年4月, 马里兰大学计算机系由Jenna Russell所带领的团队, 联合了Google DeepMind, 在arXiv这个平台上发表了一篇名为《StoryScope: Investigating idiosyncrasies in AI fiction》的论文, 也就是名为《故事显微镜: 探究AI小说的特质》的那篇论文。

5月28日, 沃顿商学院的教授Ethan Mollick, 在X之上分享了这篇论文, 他配文表述为: “针对AI写作风格特征, 像破折号这一类的, 已经有诸多的论述, 然而这篇论文所聚焦的是AI的叙事特征。AI与人类叙事之间, 存在着令人着迷的不同状况, 而且就算让AI采用不同的风格去写作, 也几乎难以对这一情况产生改变。”。

Gemini写小说被解剖：AI叙事与人类差在哪？-第1张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

Ethan Mollick在X上分享的论文核心图表, 是于2026年5月28日分享的, 该图表获得了31.5万次查看。

只是短短一天的时间, 这条推文竟已得到三万一千五百次的查看, 三千多个点赞以及将近六百次的转发, 人工智能领域圈子里的学者、从事写作的人、普通的读者都被同一个问题给吸引了, 那就是人工智能到底会不会讲述故事呢?

他们收集了计数为10272个的写作提示, 此写作提示等同于写作题目, 每个提示都要让人类作者以及五个大语言模型亦即Claude、DeepSeek、Gemini、GPT、Kimi分别去写一篇故事, 而每篇故事约为5000词, 这实验的规模大得惊人。最终是获得了数量为61608篇的故事, 接着针对每篇故事要提取出304个叙事特征。

这究竟是怎样的一种概念呢? 那就好像把超过六万多部小说的 “骨架” 一根一根地去拆开 , 然后放置于显微镜之下做出详细比对 , 从情节的结构方面 , 从角色的能动性角度 , 从时间的连贯性层面 , 再直达对话的 density 范畴 , 无一遗漏 , 无所不涵盖。

有个研究团队, 开发出了一个自动化分析管道, 它叫StoryScope, 这个管道能够从10个维度, 自动归纳出细粒度的、还可解释的叙事特征, 这些层面覆盖情节、主体、时间结构等, 之后开展对比, 查看AI生成以及人类创作出来的作品, 探究它们实质性特点究竟存在何种差异。

最终结果全然不考量用词、句式、标点这般的风格信号, 仅仅凭借叙事特征, 便能够以百分之九十三点二的准确率分辨人类与AI写作；于“六个作者分别是谁”的六类归属任务当中, 准确率达至百分之六十八点四。作为对照, 涵盖了风格线索的完整模型, 准确率仅仅高出不到百分之三。

另外来讲, AI写作的那个所谓“底层叙事逻辑”, 本身就是一张大家都能看明白的明牌。就算不论你把所有破折号全给删去, 把所有像“首先其次最后”这样的表述替换成日常口语化的表达, 你的叙事框架依旧会暴露你。

AI写故事开运真人app下载苹果版,开运真人app下载开云手机入口app下载开云app官方入口网站，到底哪里不对劲？

研究团队将核心差异归纳为五个维度。

AI极其热衷于“说教”, AI创作出的故事, 仿若一位极度担心你理解不了的语文老师, 在77%的情形之下, AI的叙事者会很直接地阐明故事主题: “这个故事要告知我们……”, 然而人类作者的这一占比仅为52%, 且AI故事里的对话出现哲学讨论的比例为59%开云真人app,开云真人app地址，但人类的这一比例仅有34%。

更为明显的是: , AI针对其他作品的引用通通都是“模糊的暗指”, 这种情况占比为72%。可人类作者却更偏向于直接表述为“像《百年孤独》里那样”。明确提及作品名称所占比例为50%。AI的潜在话语好像是: “我告知你一个道理, 你认真聆听”。人类的潜在话语则是: “你自行品味”。

你或许会讲, 这难道不是极为负责任的表现吗? 将道理阐释明白难道不好吗? 关键之处在于, 优秀的故事向来并非依靠“讲道理”去打动人心。托尔斯泰不会于《安娜·卡列尼娜》的末尾写下“这个故事向我们揭示, 出轨不会有好的结局”——他是让读者自行去体悟感受。然而AI却做不到“放开手”置之一旁, 它必定要把方方面面都细致地诉说透彻。

人类具备“跳时间线”的能力, AI却只会沿着单一方向持续向前不改变。人类讲述故事热衷于运用多样方式: 先是从葬礼场景开始, 接着回溯几十年前发生的事, 之后再陡然跳转至当下。这种并非按照线性呈现的叙事方式在AI这里几乎是不存在的。有数据表明: 79% 的AI所生成的故事“不存在支线情节”, 然而人类故事里此方面的比例为57%。AI故事中以主角驱动形成结局的占比达69%, 而人类故事的这一占比仅为46%。

人类更倾向于使故事处于“悬而未决”状态, 将以供读者进行想象的空间留出来, 人类所创造故事的结局更倾向于那种开放式的、模糊的模式, 从而让读者自行去思索“后续究竟如何”, AI却必定要给每一个角色一个明确的结果: 主角要不然就是突然领悟了, 要不然就是对现实状况予以接受（占据比例为47%）, 然而人类之中仅有27%的情况是如此这般。

为了说明情况, 研究团队给出了一个很形象的事例: 要是分别着手去创作一个悬疑故事, 人类说不定会选择自葬礼起始, 接着再去倒叙几十年以往所结下的恩怨纠葛；与之不同, AI则会依循着第一条线索起步, 依照时间的先后顺序一路顺畅推进直抵大结局而去, 全程不会存在任何有着变动迹象的“支道”呢。

对“身体描绘、叙述”有着过度沉迷倾向的AI, 返回到起始之处的检测。在AI进行创作时, 最为突出、明显的特性当中的一个表现为, 不会径直、直接地表述情感、情绪, 而是凭借身体的相应反应以及周围环境的细致描绘来将情绪“演绎、呈现”出来。

经数据呈现, 在总共的情况之中, 占据81%的情形下, AI会借助生理所产生的感受以及身体方面的隐喻这种方式, 去传递情绪, 而人类在相同情况之下仅有38%。其中, AI利用嗅觉意象的程度, 高达整个比例中的82%, 相比较而言人类仅占到57% , 并且AI还偏好将环境设定作为映射角色内心状态的一种途径。反观人类作者若是要表述“张三害怕了”时, 仅仅用简单直白的一句话来进行。

人工智能写“害怕”时, 会出现胸口发紧的情况, 会有冷汗直流的表现, 灯光会随之变暗, 空气中会弥漫着特定某种气息……人类明确使用情绪标签, 也就是“感到害怕”“很愤怒”这种表述的比例是29%, 然而人工智能仅有8%这一比例。这暴露出一个本质方面的问题: 人工智能不存在真正的情绪体验, 它仅仅能够从训练数据里学习“情绪的外在表现”, 之后运用一种类似“教科书式”的方式将它们进行堆砌。

它晓得恐惧会致使人体发汗这个情况, 然而它可不明白出汗究竟是怎样的一种感受。故而, 它开展描述时, 时常会体现出那般一种“使劲过度”而浮现出异样冲突的感觉, 这又恰似若有一人从未品尝过柠檬, 却偏要去形容柠檬所具备的酸味儿呢。

AI只会默默闷头去写, 而人类会“打破第四面墙”, 人类中28%的作品会用到这种打破“第四面墙”的写法, 即像“你, 亲爱的读者, 一定猜不到接下来发生了什么……”以此和读者直接对话, 这是人类作者拥有的一项AI学不会的绝活, 相比之下, AI作品中只有7%这样做。

当中, 人类在写作之时所牵涉到的具体文本以及作者的比例差不多是人工智能的两倍（比例分别为百分之四十七与百分之二十四）。人类能够非常顺畅地在显性引用与隐性参考这两者之间进行转换（百分之三十七的人类作品属于“混合模式”, 人工智能的占比仅仅为百分之十六）, 然而人工智能只能够隐匿在模模糊糊的暗指后面, 可以这样说就好像其万分害怕暴露出自身“没读过多少书”一样。

这绝对不是由于AI自身“未曾读过相关内容”, 它的训练数据之中涵盖了各种各样的书籍, 而是因为它根本不清楚究竟何时应当表明“我正在引用” , 何时又应当选择保持沉默, 也就是说, AI所进行的叙事属于那种“缺乏读者意识”的叙事方式, 它并不在意你是否正在观看, 也不在意你是否能够跟得上它的节奏, 它仅仅如同机械一般只是在“完成任务”。

有着严重“撞脸”情况的AI的故事, AI所生成的各式故事呆在“叙事空间”里挤成密密麻麻的一团状, 但是, 另一边厢, 人类所具备的故事如星辰般散落在各个不同的方向。再者, 人类的故事素材库要比AI更为丰富, 其涵盖涉及到更多的地点, 整个故事内对话占据的比例更高, 而且还有更多的支线巧妙融合进核心主题里呢（比例是42%对比21%）, 并且, 人类的故事也更加经常去塑造那种存在道德矛盾状况的主角呢（比例为59% versus 38%）。

人类所涉及的主角, 存在着这样的情况, 既能够是好人, 与此同时也能够是坏人, 并且还能够呈现出既善良又自私的特质；而AI所涉及的主角, 却倾向于那种“伟光正”的形象。AI所面临的问题并非是“写得不好”这种状况, 而是呈现出“写得都一样”这类情形。它被困于一个极为狭窄的“默认叙事模板”之中, 难以从中脱离出来。哪怕你给予不同的AI模型同一个提示词, 然而它们所写出的故事, 在叙事空间里面的位置, 却惊人地相近。

每个AI都有自己的“叙事指纹”

这是关于论文的最有趣的发现, 不同AI模型写故事的方式, 如同各不相同的作家的“笔迹”那般, 各自都存在着毛病。

在论文摘要里头, 清楚地把三个模型所具有的指纹特征一一列了出来, 其中Claude的事件升级情形特别平淡, GPT过度运用梦境序列, Gemini按默认方式采用外部视角去描述角色。鉴于依据论文实验数据做的进一步分析得出的推断, DeepSeek和Kimi同样展现出各自极为明显鲜明独特的叙事倾向。

有着怎样的含义呢? 要是你目睹一篇小说之中频繁地出现“梦境的转折”这种情况, 那么十有八九是GPT所创作；要是整个故事毫无波澜, 情节的推进如同平淡无味的白开水一般, 那么大概率是Claude的创作手笔；要是每个角色都是从外部进行描述, 犹如在翻看人物档案卡片似的, 那Gemini肯定是作者。更为独特的是, 运用这些“指纹”来进行六类归属（也就是从五个AI模型以及人类之中识别出具体的作者）, 其准确率竟然高达68.4%。

甚至更让人心里刺痛的是, 一份论文里还揭示出, 所有借助AI模型所生成的故事, 在叙事的那个空间里, 均聚集于同一个共享区域, 然而人类创作出来的那些故事, 却是零散分布在更为宽广的空间当中的。

即便你是Claude, 又或是GPT, 无论你的“写作风格”怎样去调整, 你们的“叙事DNA”事实上是一家人。这样的“叙事趋同”现象, 或许是大语言模型训练范式的某类固有问题, 它们皆是从相似的语料当中去学习“什么叫一个好故事”, 接着得出了相似的结论。

“去AI味”还有意义吗？

这项研究出现之际, 正好“去AI味”成了热门话题, 在论文发布的同一个月, 中文互联网上涌起对“豆包体”的群嘲, 就是那些“最”“非常”“深深地”到处都是的AI生成文本, 把网友笑得直打鸣, 各种“消除AI味的不完全手册”也随之产生, 与此同时, 尼日利亚作家纳齐尔的小说《林间之蛇》被指有大量“AI写作痕迹”, 文学界的AI写作争议愈发激烈了。

然而, StoryScope得出的结论, 犹如一盆冷水被猛然泼下: 去修改词汇, 变换句式, 调整标点, 这般种种, 皆属“表面功夫”；你要求AI写出“我很难过”的表达, 进而取代“一股悲伤涌上心头”的表述, 却无法改变其叙事结构；你将所有破折号统统删去, 同样改变不了它那种偏爱单线程叙事, 回避道德模糊性的所谓 “底层代码”。

推文中, Ethan Mollick特别强调, 这这样提及, 要求AI使用不同风格进行写作这一行为, 也几乎难以改变叙事层面的那些差异。

这实际上涉及到了一个更为深刻的问题, 那就是, AI究竟可不可以“如同人类那般”进行创作呢?

在风格的层面上去看, 是可行的。提示词被写得很不错, AI能够模仿出海明威所具备的简洁、博尔赫斯呈现出的迷宫以及王小波展现的戏谑。可是从叙事的层面来进行审视, AI在“怎样去编故事”这个事情上, 与人类存在着一种根本性的差异, 那便是它没有经历过生活, 不懂得死亡的含义, 不清楚什么叫做“欲说还休”, 故而它只能遵照一个“标准的故事模板”。

这或许才是AI写作和人类写作之间，最难以跨越的鸿沟。

在论文的终止部分, 从事研究的团队抛出了一个值得深入思考的问题, 那就是, 当AI生成的文本越来越多地掺和进人类所进行的创作范围里时, 我们该凭借什么来界定“原创性”呢?

他们将StoryScope的全部代码公开了, 还公开了10272个写作提示, 以及51336篇AI生成的叙事文本, 其中部分提示因生成失败没被纳入呢, 以此供学术界做进一步深入研究。这里展现出的一种情形更像是一种“预警”, 也就是当AI生成的文字如洪水一般大量涌入文学市场的时候, 我们是需要一套能够穿透表层、并直接抵达叙事底层的“照妖镜”的。

对于每一个借助AI来辅助写作的人而言, 这篇论文或许也在提点, 别单单想着“去除AI的味道”, 要思索你真正需要表达的是什么, 因为AI能够帮你创作出表达流畅的文字, 然而它永远没办法为你去经历一段人生, 而后者方才是好故事的真正源头（本文首发钛媒体APP, 作者 | 硅谷Tech_news, 编辑 | 焦燕）。

标签： AI写作叙事特征人类差异故事分析技术局限

本文地址： http://www.yourphoneheres.com/post/2017.html