在花
返回时间线
· 18:57 · 已编辑 · 129 条回复 ·

iPhone 通过 SSD 流式读取运行 400B 模型

400B 模型在 iPhone 上通过 SSD 流式读取和 Flash-MoE 引擎运行,仅占用 5.5 GB 内存,速度为 0.6 token/s。

Anemll

🌸 在花频道 · 茶馆讨论 · 投稿通道

Telegram 评论区

129 条回复,可以前往 Telegram 继续讨论。

去评论区