В последние годы сложность ИИ-моделей удваивается в среднем каждые два месяца, и пока что эта тенденция сохраняется. Всего три года назад году Google обучила «скромную» модель BERT с 340 млн параметров за 9 Пфлоп-дней. В 2020 году на обучение модели Micrsofot MSFT-1T с 1 трлн параметров понадобилось уже порядка 25-30 тыс. Пфлоп-дней. Процессорам и GPU общего назначения всё труднее управиться с такими задачами, поэтому разработкой специализированных ускорителей занимается целый ряд компаний: Google, Groq, Graphcore, SambaNova, Enflame и др. Особо выделятся компания Cerebras, избравшая особый путь масштабирования вычислительной мощности. Вместо того, чтобы печатать десятки чипов на большой пластине кремния, вырезать их из пластины, а затем соединять друг с другом — компания разработала в 2019 г. гигантский чип Wafer-Scale Engine 1 (WSE-1), занимающий практически всю пластину. 400 тыс. ядер, выполненных по 16-нм техпроцессу, потребляют 15 кВт, но в ряде задач они оказываются в сотни раз быстрее 450-кВт суперкомпьютера на базе ускорителей NVIDIA.
28.08.2021 6:18
Кластер суперчипов Cerebras WSE-2 позволит тренировать ИИ-модели, сопоставимые по масштабу с человеческим мозгом
Читайте также
- Netflix показала жуткий трейлер хоррора Unhinged от создателей Oxenfree
- Rockstar подтвердила: физическая версия GTA 6 выйдет без диска, внутри коробки будет только код загрузки
- Китайский суперкомпьютер LineShine стал самым мощным в мире, обойдя американский El Capitan
- Мужчина съел 224 яйца за неделю ради белка: эксперты объяснили, почему такая диета опасна
- Samsung официально представила Galaxy A27 5G с AMOLED-экраном 120 Гц, Snapdragon 6 Gen 3 и защитой IP64
- Можно ли эксгумировать тело для кремации в России: порядок, сроки
- Сингуматор на похоронах: ритуальный лифт для опускания гроба
