Забрзувачот на нервната мрежа базирана на FPGA ги надминува графичките процеси
Беше прикажано како GoogLeNet Inception-v1 CNN, користејќи осум-битна цел број. Постигна 16,8 terra операции во секунда (TOPS) и може да заклучи над 5.300 слики во секунда на Xilinx Virtex UltraScale + XCVU9P-3 fpga. Модуларниот, скалабилен пристап, го прави погоден за апликации за откривање на предмети и обработка на видео на работ и во облакот, објасни Фаукет, како и за заклучок во центри за податоци и интелигентни камери.
DPU може да се конфигурира за да обезбеди оптимално пресметување на перформансите за топологии на нервната мрежа во апликациите за машинско учење, користејќи ја паралелната архитектура DSP, дистрибуираната меморија и преобличливоста на логиката и поврзаноста за различни алгоритми.
DPU остварува над 50% повисоки перформанси од сите конкурентни CNN и ги извршува графичките процесорски задачи за даден буџет на моќност или цена, тврди компанијата. „Fpga е платформа и архитектура во светски рамки, која е многу флексибилна за бесплатен доказ за иднината и може да ги надмине графичките процесор во АИ, со помала латентност“, додаде Фаутт.
Компанијата исто така објави дека го спонзорира DPhil (PhD0 на Универзитетот Оксфорд) за да ги проучи техниките за спроведување на длабоко забрзување на учењето на fpgas. Работата ќе биде во соработка со сопственото истражување на Омниттек за компјутерски мотори и алгоритми за АИ.
