Login
From:
spaces.ac.cn
(Uncensored)
subscribe
缓存与效果的极限拉扯:从MHA、MQA、GQA到MLA - 科学空间|Scientific Spaces
https://spaces.ac.cn/archives/10091
links
backlinks
Roast topics
Find topics
Find it!
前几天,幻方发布的DeepSeek-V2引起了大家的热烈讨论。首先,最让人哗然的是1块钱100万token的价格,普遍比现有的各种竞品API便宜了两个数量级,以至于有人调侃“这个价格哪怕它输出乱...