Optimizing Block-Sparse Matrix Multiplications on CUDA with TVM

2020

Online Elektronische Ressource

Zugriff:

View this record from OAIster (Volltext)

We implemented and optimized matrix multiplications between dense and block-sparse matrices on CUDA. We leveraged TVM, a deep learning compiler, to explore the schedule space of the operation and generate efficient CUDA code. With the automatic parameter tuning in TVM, our cross-thread reduction based implementation achieved competitive or better performance compared with other state-of-the-art frameworks.

Titel:	Optimizing Block-Sparse Matrix Multiplications on CUDA with TVM
Link:	View this record from OAIster (Volltext)
Veröffentlichung:	2020
Medientyp:	Elektronische Ressource
Schlagwort:	Index Terms: Computer Science - Mathematical Software Computer Science - Distributed, Parallel, and Cluster Computing Computer Science - Machine Learning Mathematics - Numerical Analysis text
Sonstiges:	Nachgewiesen in: OAIster Added Details: Gu, Zijing Document Type: Electronic Resource Availability: Open access content. Open access content Contributing Source: CORNELL UNIV ; From OAIster®, provided by the OCLC Cooperative.

Klicken Sie ein Format an und speichern Sie dann die Daten oder geben Sie eine Empfänger-Adresse ein und lassen Sie sich per Email zusenden.

BibTeX Citavi, JabRef, u.a.
(Literaturverwaltung)

PDF kein Volltext!
(Merkzettel, Notizen)

RIS Endnote, Citavi u.a.
(Literaturverwaltung)

MODS
(XML zur Weiterverarbeitung)

oder

Wählen Sie das für Sie passende Zitationsformat und kopieren Sie es dann in die Zwischenablage, lassen es sich per Mail zusenden oder speichern es als PDF-Datei.

Gewünschter Zitations-Stil:

oder

Bitte prüfen Sie, ob die Zitation formal korrekt ist, bevor Sie sie in einer Arbeit verwenden. Benutzen Sie gegebenenfalls den "Exportieren"-Dialog, wenn Sie ein Literaturverwaltungsprogramm verwenden und die Zitat-Angaben selbst formatieren wollen.