Groq представляет первый ускоритель PetaOPS AI

0
48

Новейший ускоритель ИИ спроектирован таким образом, чтобы обеспечить задержки в 320 раз меньше, чем у конкурирующих решений Nvidia

Groq — небольшая компания, о которой до недавнего времени почти никто не слышал. Стартап пытается создать один из самых быстрых ИИ ускорителей, доступных на рынке. Это должна быть система, которая превысит порог в 1 квадриллион операций в секунду . Это означает, что карта в четыре раза быстрее, чем самое мощное решение такого типа, выпускаемое Nvidia .

Источник: Грок

Для потокового процессора Groq Tensor (TSP) требуется до 300 Вт мощности на каждое ядро. К счастью, эта карта, в отличие от своих конкурентов, имеет только одно ядро. Groq превратил недостаток ускорителей ИИ в их преимущество.

Представленный TSP был построен совершенно иначе, чем любые другие конкурирующие видеокарты, ускорители ИИ и подобные системы. Это большой кусок кремния, который содержит только векторные и матричные процессоры и кеш-память. Там не было контроллеров.

TSP делится на 20 суперлиний. Сложный процесс, происходящий внутри суперлинии, способствовал значительному увеличению производительности системы. В целом новый процессор незаменим при обучении нейронных сетей . В этом типе приложения небольшой стартап сметает системы Tesla производства Nvidie.

В определенных приложениях Groq Tensor TSP в два раза эффективнее системы Nvidia . К сожалению, во многих случаях, однако, оказывается, что необычный дизайн и отсутствие программного обеспечения, которое может эффективно использовать его, вызывает значительное снижение производительности. Дополнительной проблемой является отсутствие встроенной памяти. Конкурентные чипы Nivdia предлагают до 32 ГБ оперативной памяти.

Так зачем использовать такую ​​специфическую систему? В будущем процессор Groq можно будет использовать в современных автомобилях . В автомобилях количество входных и выходных данных предсказуемо, и вся система не расширяется в течение своего жизненного цикла. Это означает, что использование процессора TSP в автомобиле может привести к тому, что в целом будет гораздо более эффективным и предлагать задержки до 320 раз.

Источник: techspot.com