详细介绍
Papercuts 是一个专为 **AI 应用开发者与 SaaS 产品团队** 设计的 **生产环境 AI Agent 健康监测平台**。它的核心使命是解决 AI Agent 在真实用户场景中“静默失效”的关键难题——当 Agent 集成进生产应用后,因 UI 变更、API 更新、权限调整或模型退化导致功能异常,却无法被传统测试覆盖或及时告警。
通过让 AI Agent 以真实用户身份在生产环境中持续运行(即 “Test in Production”),Papercuts 自动捕获交互链路中的断裂点,并在问题发生的第一时刻推送精准告警,帮助团队将 AI 功能的可用性从“尽力而为”提升至“可监控、可度量、可保障”的工程化水平。
📊 核心价值与量化收益
90%
降低 AI 功能线上故障发现延迟
5分钟
平均故障定位时间
100%
覆盖关键用户旅程路径
零代码
快速接入现有生产应用
🧱 核心技术模块
| 模块 | 功能描述 |
|---|---|
| Production Agent Runner | 在真实生产环境模拟用户行为,驱动 AI Agent 执行端到端任务(如登录→搜索→下单→确认),无需修改业务代码。 |
| Breakpoint Detection | 智能识别交互中断点:页面加载失败、按钮不可见、API 返回异常、模型输出格式错误等,并精确定位至 DOM 元素或响应字段。 |
| Real-time Alerting | 支持 Slack、Email、Webhook 等多通道即时告警,附带完整执行快照(截图、网络日志、LLM 调用链),实现“所见即所得”排障。 |
| Journey Versioning & Diff | 自动保存用户旅程快照版本,对比前后差异,直观呈现 UI/流程变更对 AI Agent 的影响范围。 |
| Failure Analytics Dashboard | 聚合分析失败类型、高频中断节点、关联发布版本,驱动产品与工程团队协同优化 AI 健壮性。 |
| One-Click Replay | 点击任意失败记录,一键复现完整执行过程,加速本地调试与回归验证。 |
💰 定价方案
Papercuts 采用简洁透明的月度订阅制,按“监控旅程数”计费,无隐藏成本,所有功能均在免费版开放体验。
| 方案 | 定价 | 核心权益 | 适用阶段 |
|---|---|---|---|
| 免费版 | $0 1 条旅程 |
全功能访问:Production Runner、Breakpoint Detection、Slack Alerting、Dashboard、Replay | 概念验证与早期集成 |
| 专业版 | $99/月 5 条旅程 |
增加:Email/Webhook 告警、自定义检查逻辑、历史数据保留 30 天 | 多场景 AI 功能上线 |
| 团队版 | $299/月 20 条旅程 |
增加:团队协作空间、角色权限管理、API 访问密钥、SAML 单点登录 | 跨职能团队规模化使用 |
| 企业版 | 定制报价 | 全面能力:私有化部署、专属 SLA、审计日志、高级安全合规认证(SOC2/ISO27001) | 金融、医疗等强监管行业 |
🎯 解决的核心商业问题
| 商业陷阱 | 导致的后果 | Papercuts 的解决方案 |
|---|---|---|
| “黑盒式 AI 上线” | AI 功能上线后缺乏可观测性,用户投诉才知失效,损害品牌信任与转化率。 | 以真实用户视角持续运行 Agent,主动暴露问题,变被动响应为主动防御。 |
| “UI 变更即崩塌” | 前端迭代频繁导致 AI Agent 选择器失效、字段定位错误,维护成本飙升。 | Breakpoint Detection 精准定位 DOM 层级断裂点,结合 Journey Diff 快速定位变更影响。 |
| “测试覆盖率盲区” | 单元测试与 E2E 测试无法覆盖 LLM 输出不确定性、第三方 API 波动等真实生产变量。 | 在真实生产流量与依赖环境下运行,覆盖模型、API、UI、权限全链路。 |
| “故障归因模糊” | 分不清是模型退化、Prompt 失效、API 错误还是前端 Bug,团队互相甩锅,修复周期长。 | 执行快照完整记录每一步输入输出与上下文,实现跨层故障归因与责任界定。 |
