上下文窗口越来越大，AI写小说为什么还是写到30章就崩？

做后端做了六年，我一直以为上下文窗口越大，AI 写小说就越不容易崩。

200K 不够就上 500K。500K 不够就上 1M。逻辑很直——把整本书塞进去，AI 全看到了，自然不会忘。

然后我拿一个写了 3 万字开头的都市异能故事，在一个标称 200K 窗口的模型上跑。

头 10 章，很好。

第 15 章开始出问题。主角有个设定：左臂受过伤，不能长时间发力。第 15 章里他单手翻墙翻得比体操运动员还利索。

我提醒了一次。

第 22 章又来了。不是翻墙，是在酒吧跟人起冲突，上去就是一拳。很猛。但不对。

第 30 章，主角怕水的设定丢了。让他跳河，他二话不说就跳。

不是模型不够聪明。是在 30 章、大约 9 万字的上下文里，模型"看不过来"。

上下文窗口不是记忆

打个比方。

上下文窗口是你面前摊开了一本书，你能看到当前这一页。记忆系统是你脑子里的书架——你知道打开哪一本、翻到哪一页，能找到你需要的那句话。

长篇写作需要的是后者。

你把整本书的设定、角色档案、前文摘要全塞进上下文，效果其实很差。模型并不会因为信息量多就自动知道该看哪里。关键信息被几十万字的海洋稀释，反而更容易出错。

这不是我的个人感受，是信息检索里的一个基本原理：信噪比。上下文越长，噪声越多，信号越难被模型准确捕获。

那蛙趣拼文是怎么做的？

四层上下文，按需组装

蛙趣拼文的方案是：不搞"全塞进去"。把信息分成四层。

第一层，即时层。

当前章节必须看到的信息——本章大纲、上一章结尾、出场角色的当前状态、适用的世界观规则。这一层在每次生成时完整注入。量不大，因为只是"这一章相关的"，不是"全书所有的"。

第二层，章节摘要层。

前文所有已写章节的摘要。不是原文，是摘要——每章谁出场了、发生了什么、结局是什么。信息密度高，占用 token 少。写到第 50 章的时候，前面 49 章的摘要全部可见，但总体 token 消耗跟灌两章原文差不多。

第三层，作品全局层。

角色总表、世界观规则全集、伏笔追踪面板。这一层不是每次全量注入，是按需抽取。这一章涉及 3 个角色和 2 条世界观规则，系统就只拉这 3 个角色的当前状态和这 2 条规则。其他的不塞。

第四层，知识层。

素材库里存储的风格特征和写作习惯模板。这一层不直接影响剧情走向，但在素材融合和精修环节被调用——影响"怎么写"，而不是"写什么"。

章节摘要才是真正的记忆载体

这里我想单独说一下章节摘要。这个设计很聪明。

写完一章之后，蛙趣拼文可以生成一个章节摘要。不是文采飞扬的总结，是事实层面的记录——这章谁出场了、做了什么、结局是什么、产生了什么新信息。

这些摘要被存下来。写后面章节的时候，前面所有章的摘要会进入上下文。

它不是在每次生成时从零开始翻几十万字原文。它是先翻"笔记"——每章一段摘要，信息密度极高。像给 AI 做了一份前情提要，翻起来快，信息不丢。

我跑完 50 章的对比测试：

方案	表现
单层方案（大设定文档）	第 8 章开始出现细节错误，中间部分被模型忽略
四层方案（蛙趣拼文）	50 章零角色错乱、零设定违反、零关键物品丢失

伏笔追踪方面，50 章里埋了 12 个伏笔，收了 10 个，废弃 1 个，留了 1 个开放线索——基本在可控范围。

上下文工程的本质

总结一句话：不是窗口不够大，是没有把信息组织好。

蛙趣拼文的上下文工程，本质上是一个分层检索框架。即时层全量注入，章节层摘要压缩，作品层条件检索，知识层按需调用。每一层有不同的存储策略和注入策略。

这个思路在知识库系统和 RAG 应用里不算新鲜。但把它系统性地用在 AI 写小说这个场景里，而且把"章节"这个维度单独拎出来作为独立的信息层，是目前看到的方案里做得比较清晰的一个。

对关注长篇创作的技术人来说，上下文工程可能是蛙趣拼文所有设计里最"工程化"的一层。它不是靠更好的提示词，是靠更好的信息架构。

了解更多技术细节，可查看 AI写小说工具技术评测：从RAG记忆到千章大纲或访问蛙趣拼文官网。

上下文窗口越来越大，AI写小说为什么还是写到30章就崩？ ​

上下文窗口不是记忆 ​

四层上下文，按需组装 ​

章节摘要才是真正的记忆载体 ​

上下文工程的本质 ​

上下文窗口越来越大，AI写小说为什么还是写到30章就崩？

上下文窗口不是记忆

四层上下文，按需组装

章节摘要才是真正的记忆载体

上下文工程的本质