Roast topics
Find topics
Roast it!
Roast topics
Find topics
Find it!
Login
From:
科学空间|Scientific Spaces
(Uncensored)
subscribe
为什么Adam的Update RMS是0.2?
https://spaces.ac.cn/archives/11267
links
backlinks
众所周知,我们很早就开始尝试将Muon用于大规模LLM的训练。特别地,在《Muon续集:为什么我们选择尝试Muon?》中,我们提出了“Match Adam Update RMS”的技巧,以便快速...