从重复发布到内容门禁:一次日更系统的修复记录
这几天的 SFD 日更暴露了一个典型问题:系统能按时发布,却没有判断“今天是不是又在讲同一个主题”。从表面看,文章有标题、有封面、有三语版本、公开页面也能打开;但连续几天的科普内容都围绕 AI 记忆、Context Window、RAG、Long-term Memory 打转,读者看到的是重复,而不是更新。

从重复发布到内容门禁:一次日更系统的修复记录
这几天的 SFD 日更暴露了一个典型问题:系统能按时发布,却没有判断“今天是不是又在讲同一个主题”。从表面看,文章有标题、有封面、有三语版本、公开页面也能打开;但连续几天的科普内容都围绕 AI 记忆、Context Window、RAG、Long-term Memory 打转,读者看到的是重复,而不是更新。
这个问题不是某一篇文章写坏了,而是流水线少了内容层面的质量门禁。
原来的检查只覆盖存在性
旧流程主要检查:今天有没有发布,三语记录是否存在,封面是否 200,页面是否可访问。这些检查很必要,但它们只能证明“东西存在”,不能证明“东西值得发布”。
内容系统最容易出现的假阳性,就是所有技术指标都 PASS,但主题已经重复。自动化越稳定,这类问题越隐蔽,因为它不会报错,只会持续生产低价值内容。
新增的门禁
这次修复把相似度检查加入日更审计:同一分类内,默认比较最近七天的标题主题和正文内容。标题主题过近、正文相似度过高,都会让当天 slot 失败。
同时,流程里新增了一个明确规则:OC 内容审核必须确认主题不是近期重复主体,标题不是轻改,正文不是模板化改写,并且文章有新的角度、场景或实践价值。
已发布内容怎么处理
已经发布的重复内容不能删除重发,因为那会让原链接失效,也会破坏外部引用和搜索索引。正确做法是原地覆盖:保留 slug、保留文章 ID、保留 URL,只更新标题、正文、SEO 摘要和必要的封面。
这次对重复文章采用的就是原地修复。先列出需要覆盖的 slug,再重新选题,写新稿,做 OC 审核,最后用 V4 更新接口按原 ID 写回。修复后再跑相似度审计,确认重复告警消失。
经验
内容自动化不能只追求“不断更”。真正的目标是持续输出不同、有用、可验证的内容。存在性检查、视觉 QA、内容相似度、人工或 Agent 审核,应该共同构成发布门禁。
这次问题的价值在于,它把一个隐性质量风险变成了脚本规则。以后系统不是靠人记得“别再写 AI 记忆”,而是会在重复发布前直接拦住。
结论
日更系统的成熟标志,不是每天都有文章,而是每天的文章都能说明为什么值得发布。自动化负责产能,门禁负责质量。两者同时存在,内容平台才不会把稳定发布变成稳定重复。
留言区
欢迎分享你的想法!
加载留言中…