SpaceTiD | EcoBox 算力预测工具

SpaceTiD 计算中

请输入算力预测基础参数

项目名称

应用类型

行业

并发用户数人

模型规模

单次请求长度

项目A

金融 / 对话助手

当前按 14B 模型与中等文本请求规模进行推理资源估算。

0 卡

推荐 GPU 数量

按算力：0 卡；按显存：0 卡

0

峰值算力需求

按 Token 吞吐与模型激活参数估算的峰值算力。

0

总显存需求

包含参数驻留、激活显存和 KV Cache 显存。

Token 生成速率 token/s

模型精度

GPU 利用率假设

冗余系数

单卡 GPU 理论算力

文本请求占比

图像请求占比

图像 FLOPs 放大系数

趋势分析

并发用户增长趋势

不同模型规模所需的 GPU 数量和显存需求

请求长度与算力需求变化

存档预测

上海火棘果数字科技有限公司

联系我们
电话：021-80411593
邮箱：official@spacetid.com
Copyright ©2023 SpaceTiD | 沪ICP备2023030137号-1

微信扫描二维码
关注火棘果数字官方公众号