Zum Hauptinhalt springen

4.6-Bit Quantization for Fast and Accurate Neural Network Inference on CPUs.

Trusov, Anton ; Limonova, Elena ; et al.
In: Mathematics (2227-7390), Jg. 12 (2024-03-01), Heft 5, S. 651-672
Online academicJournal

Volltext verfügbar nach Anmeldung bzw. im Campus-Netz.

Titel:
4.6-Bit Quantization for Fast and Accurate Neural Network Inference on CPUs.
Autor/in / Beteiligte Person: Trusov, Anton ; Limonova, Elena ; Nikolaev, Dmitry ; Arlazarov, Vladimir V.
Link:
Zeitschrift: Mathematics (2227-7390), Jg. 12 (2024-03-01), Heft 5, S. 651-672
Veröffentlichung: 2024
Medientyp: academicJournal
ISSN: 2227-7390 (print)
DOI: 10.3390/math12050651
Schlagwort:
  • CONVOLUTIONAL neural networks
  • CENTRAL processing units
  • MULTIPLICATION
Sonstiges:
  • Nachgewiesen in: Complementary Index
  • Sprachen: English

Klicken Sie ein Format an und speichern Sie dann die Daten oder geben Sie eine Empfänger-Adresse ein und lassen Sie sich per Email zusenden.

oder
oder

Wählen Sie das für Sie passende Zitationsformat und kopieren Sie es dann in die Zwischenablage, lassen es sich per Mail zusenden oder speichern es als PDF-Datei.

oder
oder

Bitte prüfen Sie, ob die Zitation formal korrekt ist, bevor Sie sie in einer Arbeit verwenden. Benutzen Sie gegebenenfalls den "Exportieren"-Dialog, wenn Sie ein Literaturverwaltungsprogramm verwenden und die Zitat-Angaben selbst formatieren wollen.

xs 0 - 576
sm 576 - 768
md 768 - 992
lg 992 - 1200
xl 1200 - 1366
xxl 1366 -