M1-06 Quota/Cost 闭环 #20

Open
opened 2026-05-22 21:03:50 +08:00 by wangdl · 0 comments
Owner

目标

在 M0-11 Quota/Billing/Cost 基础版之上实现成本记录闭环,确保所有 AI/OCR/Vision/Embedding/RAG 调用的消耗都能被精确记录并按服务商/模块/用户维度汇总。

本 Issue 只做深化设计,基础能力(额度管理、会员计划、成本记录)已在 M0-11 完成。

背景说明

M0-11 建立了 Quota 和 Cost 的数据模型。本阶段需要打通"AI Gateway 产生 AIUsageLog → Cost 模块消费事件 → 成本汇总 → Admin 成本报表"的完整链路。

核心目标是:任何一次 AI 调用都能在 Admin 成本报表中查到它的消耗,并可按服务商、模块、用户、时间等维度聚合。

模块深化内容

  1. AIUsageLog → Cost 事件消费链路:

    • AI Gateway 发布 AIUsageRecorded 事件
    • Cost 模块订阅 AIUsageRecorded,写入 ExternalApiUsageLog
    • 实时更新 CostDailySummary
  2. 成本汇总:

    • 按日/周/月自动汇总各服务商的成本
    • 按模块(RAG Chat/Learning/Ingestion/Artifact)分拆成本
    • Top 消耗用户排行
  3. Admin 成本报表:

    • 总成本概览(今日/本周/本月)
    • 按服务商分拆(DeepSeek/硅基流动/百度 OCR/Tencent COS)
    • 按模块分拆
    • 成本趋势图
    • 导出 CSV
  4. 成本预警闭环:

    • 日/周/月成本超过阈值时发送 Admin 通知

基础设施依赖变更

相比 M0-11,无新增依赖。

接口设计(新增部分)

AAPI 新增/深化:

  • 成本报表数据接口(支持多维度聚合和时间范围筛选)
  • 成本导出接口(CSV)
  • Top 消耗用户接口

Domain Event(新增)

  • CostDailySummaryUpdated:每日成本汇总更新

Admin 视图设计(深化)

  1. 成本报表页(深化):

    • 总览卡片:今日成本、本月成本、环比变化
    • 按服务商分拆的饼图或柱状图
    • 按模块分拆的柱状图
    • 成本趋势折线图
    • Top 10 消耗用户列表
  2. 成本预警页(深化):

    • 预警规则列表
    • 预警触发历史
    • Admin 通知设置

交付检查

  • 路由归属:Internal Provider 深化 + AAPI 新增/深化
  • 是否需要 Prisma migration:是(成本汇总表、预警表扩展)
  • 是否需要 MySQL:是
  • 是否需要 Redis:是(已有依赖)
  • 是否需要 BullMQ:是(异步汇总)
  • 是否需要 AI Gateway:是(消费 AIUsageLog 事件)
  • 是否需要 Cost 记录:本模块深化
  • 是否需要 AuditLog:否(成本报表查看不需要审计)
  • 是否需要 Domain Event:是
  • 是否需要 Admin 视图:是(成本报表深化)

验收标准

  1. AIUsageLog → Cost 模块事件消费链路打通
  2. 按服务商/模块/用户/时间的成本汇总方案
  3. Admin 成本报表页面设计(含图表)
  4. 成本预警和通知链路打通
  5. CSV 导出功能设计
  6. 集成测试覆盖成本记录、汇总、查询全链路

禁止事项

  • 禁止成本记录遗漏任何 AI 调用(所有 AI/OCR/Vision/Embedding 调用必须记账)
  • 禁止成本汇总延迟超过 1 小时
  • 禁止 Admin 成本报表数据与原始 AIUsageLog 不一致

不建议当前阶段实现

  • 成本预测和预算管理
  • 成本分摊到单个知识库/单个对话维度
  • 自动化成本优化建议
## 目标 在 M0-11 Quota/Billing/Cost 基础版之上实现成本记录闭环,确保所有 AI/OCR/Vision/Embedding/RAG 调用的消耗都能被精确记录并按服务商/模块/用户维度汇总。 本 Issue 只做深化设计,基础能力(额度管理、会员计划、成本记录)已在 M0-11 完成。 ## 背景说明 M0-11 建立了 Quota 和 Cost 的数据模型。本阶段需要打通"AI Gateway 产生 AIUsageLog → Cost 模块消费事件 → 成本汇总 → Admin 成本报表"的完整链路。 核心目标是:任何一次 AI 调用都能在 Admin 成本报表中查到它的消耗,并可按服务商、模块、用户、时间等维度聚合。 ## 模块深化内容 1. AIUsageLog → Cost 事件消费链路: - AI Gateway 发布 AIUsageRecorded 事件 - Cost 模块订阅 AIUsageRecorded,写入 ExternalApiUsageLog - 实时更新 CostDailySummary 2. 成本汇总: - 按日/周/月自动汇总各服务商的成本 - 按模块(RAG Chat/Learning/Ingestion/Artifact)分拆成本 - Top 消耗用户排行 3. Admin 成本报表: - 总成本概览(今日/本周/本月) - 按服务商分拆(DeepSeek/硅基流动/百度 OCR/Tencent COS) - 按模块分拆 - 成本趋势图 - 导出 CSV 4. 成本预警闭环: - 日/周/月成本超过阈值时发送 Admin 通知 ## 基础设施依赖变更 相比 M0-11,无新增依赖。 ## 接口设计(新增部分) AAPI 新增/深化: - 成本报表数据接口(支持多维度聚合和时间范围筛选) - 成本导出接口(CSV) - Top 消耗用户接口 ## Domain Event(新增) - CostDailySummaryUpdated:每日成本汇总更新 ## Admin 视图设计(深化) 1. 成本报表页(深化): - 总览卡片:今日成本、本月成本、环比变化 - 按服务商分拆的饼图或柱状图 - 按模块分拆的柱状图 - 成本趋势折线图 - Top 10 消耗用户列表 2. 成本预警页(深化): - 预警规则列表 - 预警触发历史 - Admin 通知设置 ## 交付检查 - [ ] 路由归属:Internal Provider 深化 + AAPI 新增/深化 - [ ] 是否需要 Prisma migration:是(成本汇总表、预警表扩展) - [ ] 是否需要 MySQL:是 - [ ] 是否需要 Redis:是(已有依赖) - [ ] 是否需要 BullMQ:是(异步汇总) - [ ] 是否需要 AI Gateway:是(消费 AIUsageLog 事件) - [ ] 是否需要 Cost 记录:本模块深化 - [ ] 是否需要 AuditLog:否(成本报表查看不需要审计) - [ ] 是否需要 Domain Event:是 - [ ] 是否需要 Admin 视图:是(成本报表深化) ## 验收标准 1. AIUsageLog → Cost 模块事件消费链路打通 2. 按服务商/模块/用户/时间的成本汇总方案 3. Admin 成本报表页面设计(含图表) 4. 成本预警和通知链路打通 5. CSV 导出功能设计 6. 集成测试覆盖成本记录、汇总、查询全链路 ## 禁止事项 - 禁止成本记录遗漏任何 AI 调用(所有 AI/OCR/Vision/Embedding 调用必须记账) - 禁止成本汇总延迟超过 1 小时 - 禁止 Admin 成本报表数据与原始 AIUsageLog 不一致 ## 不建议当前阶段实现 - 成本预测和预算管理 - 成本分摊到单个知识库/单个对话维度 - 自动化成本优化建议
wangdl added this to the M1:AI / RAG 运行时与检索底座(P0~P1) milestone 2026-05-22 21:03:50 +08:00
Sign in to join this conversation.
No Label
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: wangdl/api-server#20
No description provided.