Nördnytt loggaNördnytt! 🤓

MegaTrain: Full Precision Training of 100B+ Parameter LLMs on a Single GPU

arxiv.org - 217 poäng - 41 kommentarer - 27912 sekunder sedan
Kommentarer (17)

Alla inlägg kommer från HackerNews.