SpaceTiD 计算中

EcoBox 算力预测工具

请输入算力预测基础参数

项目名称
应用类型
行业
并发用户数
模型规模
单次请求长度
项目A
金融 / 对话助手
当前按 14B 模型与中等文本请求规模进行推理资源估算。
0
推荐 GPU 数量
按算力:0 卡;按显存:0 卡
0
峰值算力需求
按 Token 吞吐与模型激活参数估算的峰值算力。
0
总显存需求
包含参数驻留、激活显存和 KV Cache 显存。

Token 生成速率 token/s
模型精度
GPU 利用率假设
冗余系数
单卡 GPU 理论算力
文本请求占比
图像请求占比
图像 FLOPs 放大系数

趋势分析

并发用户增长趋势

不同模型规模所需的 GPU 数量和显存需求

请求长度与算力需求变化

存档预测