FPGA-pohjainen hermoverkon kiihdytin ylittää GPU: t
Se osoitettiin GoogLeNet Inception-v1 CNN: nä käyttäen kahdeksan-bittistä kokonaislukua. Se saavutti 16,8 terraoperaatiota sekunnissa (TOPS) ja voi päätellä yli 5300 kuvaa sekunnissa a Xilinx Virtex UltraScale + XCVU9P-3 fpga. Modulaarinen, skaalautuva lähestymistapa tekee siitä sopivan kohteiden havaitsemis- ja videonkäsittelysovelluksiin reunalla ja pilvessä, selitti Fawcett, sekä päätelmät datakeskuksissa ja älykkäissä kameroissa.
DPU voidaan konfiguroida tarjoamaan optimaalinen laskentateho hermoverkkojen topologioille koneen oppimisohjelmissa käyttäen rinnakkaista DSP-arkkitehtuuria, hajautettua muistia ja logiikan ja liitettävyyden uudelleen konfiguroitavuutta eri algoritmeille.
DPU saavuttaa yli 50% korkeamman suorituskyvyn kuin mitä tahansa kilpailevaa CNN: ää, ja se suorittaa GPU: ita tietylle teholle tai kustannusbudjetille. ”FPGA on maailmanlaajuisesti lyövä foorumi ja arkkitehtuuri, joka on erittäin joustava tulevaisuuden kestävyyteen ja voi ylittää AI: n GPU: t, pienemmällä viiveellä”, Fawcett lisäsi.
Yhtiö on myös ilmoittanut tukevansa DPhil-ohjelmaa (PhD0 Oxfordin yliopistossa opiskelemaan tekniikoita syvällisen oppimisen kiihdytyksen toteuttamiseksi fpgasissa. Työ tehdään yhteistyössä Omnitekin omien tutkimusten kanssa, jotka koskevat AI-laskentamoottoreita ja -algoritmeja.
