从重复发布到内容门禁：一次日更系统的修复记录

这几天的 SFD 日更暴露了一个典型问题：系统能按时发布，却没有判断“今天是不是又在讲同一个主题”。从表面看，文章有标题、有封面、有三语版本、公开页面也能打开；但连续几天的科普内容都围绕 AI 记忆、Context Window、RAG、Long-term Memory 打转，读者看到的是重复，而不是更新。

这个问题不是某一篇文章写坏了，而是流水线少了内容层面的质量门禁。

原来的检查只覆盖存在性

旧流程主要检查：今天有没有发布，三语记录是否存在，封面是否 200，页面是否可访问。这些检查很必要，但它们只能证明“东西存在”，不能证明“东西值得发布”。

内容系统最容易出现的假阳性，就是所有技术指标都 PASS，但主题已经重复。自动化越稳定，这类问题越隐蔽，因为它不会报错，只会持续生产低价值内容。

新增的门禁

这次修复把相似度检查加入日更审计：同一分类内，默认比较最近七天的标题主题和正文内容。标题主题过近、正文相似度过高，都会让当天 slot 失败。

同时，流程里新增了一个明确规则：OC 内容审核必须确认主题不是近期重复主体，标题不是轻改，正文不是模板化改写，并且文章有新的角度、场景或实践价值。

已发布内容怎么处理

已经发布的重复内容不能删除重发，因为那会让原链接失效，也会破坏外部引用和搜索索引。正确做法是原地覆盖：保留 slug、保留文章 ID、保留 URL，只更新标题、正文、SEO 摘要和必要的封面。

这次对重复文章采用的就是原地修复。先列出需要覆盖的 slug，再重新选题，写新稿，做 OC 审核，最后用 V4 更新接口按原 ID 写回。修复后再跑相似度审计，确认重复告警消失。

经验

内容自动化不能只追求“不断更”。真正的目标是持续输出不同、有用、可验证的内容。存在性检查、视觉 QA、内容相似度、人工或 Agent 审核，应该共同构成发布门禁。

这次问题的价值在于，它把一个隐性质量风险变成了脚本规则。以后系统不是靠人记得“别再写 AI 记忆”，而是会在重复发布前直接拦住。

结论

日更系统的成熟标志，不是每天都有文章，而是每天的文章都能说明为什么值得发布。自动化负责产能，门禁负责质量。两者同时存在，内容平台才不会把稳定发布变成稳定重复。

从重复发布到内容门禁：一次日更系统的修复记录

从重复发布到内容门禁：一次日更系统的修复记录

原来的检查只覆盖存在性

新增的门禁

已发布内容怎么处理

经验

结论

留言区

发表留言