Nota AI hat zwei Beiträge zur MoE-Quantisierung für den ICML 2026 Workshop eingereicht und beweist damit seine weltweite Wettbewerbsfähigkeit bei der Optimierung groß angelegter KI-Projekte

11.06.2026
  • Zwei Beiträge zu MoE-spezifischen Quantisierungsalgorithmen wurden für einen Workshop angenommen, der im Rahmen der ICML 2026 abgehalten wird
  • Die Auszeichnung folgt auf den Gesamtsieg von Nota AI beim NVIDIA Nemotron Hackathon
  • Stärkung der zentralen Optimierungstechnologien, um große KI-Modelle zu verkleinern und ihre Ausführung effizienter zu gestalten

SEOUL, Südkorea, 11. Juni 2026 /PRNewswire/ -- Nota AI, ein auf die Komprimierung und Optimierung von KI-Modellen spezialisiertes Unternehmen, gab bekannt, dass zwei seiner Beiträge zu MoE-spezifischen Quantisierungsalgorithmen für den Workshop „Resource-Adaptive Foundation Model Inference (AdaptFM)" im Rahmen der ICML 2026, einer der weltweit führenden Konferenzen für maschinelles Lernen, angenommen wurden.

Die ICML gilt allgemein als eine der weltweit führenden Konferenzen im Bereich des maschinellen Lernens und der künstlichen Intelligenz und vereint die neuesten Forschungsergebnisse von globalen Technologieunternehmen, führenden Universitäten und bedeutenden Forschungseinrichtungen. Der AdaptFM-Workshop konzentriert sich auf Technologien, die es ermöglichen, groß angelegte KI-Modelle unter begrenzten Rechenressourcen effizient auszuführen. Forscher von globalen Unternehmen und Forschungseinrichtungen, darunter Amazon und Meta, sind im Organisationskomitee vertreten, während Forscher von führenden KI-Unternehmen wie NVIDIA, Qualcomm AI Research, OpenAI, Apple und Microsoft ebenfalls als Mitglieder des Programmkomitees teilnehmen.

Diese Leistung ist von großer Bedeutung, da sie das gesammelte technische Know-how von Nota AI bei der Optimierung von Mixture-of-Experts (MoE)-Modellen würdigt – einer Architektur, die zunehmend als Kernstruktur für große Sprachmodelle (LLMs) angesehen wird. MoE-Modelle verbessern sowohl die Leistung als auch die Effizienz, indem sie je nach Bedarf nur eine Teilmenge von Expertenmodellen aktivieren. Ihre komplexe Struktur erfordert jedoch einen anderen Ansatz bei der Quantisierung – dem Prozess, Modelle kleiner und effizienter zu machen – als bei herkömmlichen Modellarchitekturen.

Nota AI gewann zuvor sowohl seinen eigenen Track als auch den Gesamtwettbewerb beim NVIDIA Nemotron Hackathon mit einer datengesteuerten MoE-Quantisierungsmethode. Mit der Annahme dieser beiden Beiträge wird Nota AI erneut Forschungsergebnisse, die speziell für MoE-Architekturen entwickelt wurden, auf einer globalen Forschungsbühne präsentieren.

Der erste angenommene Beitrag, „DREAM-MoE", schlägt eine Methode vor, um Veränderungen im Entscheidungsfluss eines Modells zu reduzieren, die auftreten können, wenn groß angelegte KI-Modelle über mehrere Segmente hinweg quantisiert werden. Die Methode konzentriert sich auf die Tatsache, dass selbst ein kleiner Fehler in einem früheren Segment die Expertenauswahl in späteren Segmenten beeinflussen kann. DREAM-MoE hilft dem quantisierten Modell dabei, Experten so auszuwählen, dass das Ergebnis näher am ursprünglichen Modell bleibt.

Die zweite Arbeit, „SRA-MoE", schlägt eine Methode vor, die wichtige Eingaben identifiziert und priorisiert, die einen größeren Einfluss auf die endgültige Ausgabe des Modells haben. Anstatt alle Eingaben gleich zu behandeln, ist SRA-MoE darauf ausgelegt, zu verhindern, dass die Expertenauswahl für diese Schlüssel-Eingaben erheblich gestört wird, was dazu beiträgt, die Modellqualität unter begrenzten Ressourcen effektiver aufrechtzuerhalten.

Beide Studien zeigten eine höhere Leistung im Vergleich zu den neuesten MoE-spezifischen Quantisierungsmethoden. Dies zeigt, dass groß angelegte KI-Modelle mit weniger Speicher und weniger Rechenressourcen ausgeführt werden können, während Qualitätsverluste reduziert werden. Weil die Kosten, der Stromverbrauch und die Hardware-Belastung beim Betrieb großer KI-Modelle weiter steigen, gewinnen MoE-spezifische Quantisierungstechnologien zunehmend an Bedeutung.

Nota AI hat seine Forschungs- und Entwicklungsbemühungen proaktiv auf die Optimierung großer KI-Modelle konzentriert, die erhebliche Speicher- und Rechenressourcen erfordern. Das Unternehmen treibt die Optimierung groß angelegter Modelle, darunter Solar MoE, als Teil des vom Upstage-Konsortium geleiteten Sovereign-Foundation-Model-Projekts voran. Zudem erweitert es seine Erfahrung bei der Quantisierung von NVIDIA Nemotron 3 Nano auf neuere große Modelle wie Nemotron Ultra und erweitert damit den Anwendungsbereich seiner Optimierungstechnologien weiter.

„Die Annahme dieses Beitrags spiegelt die kontinuierlichen Fortschritte von Nota AI bei MoE-spezifischen Quantisierungstechnologien wider", sagte Myungsu Chae, CEO von Nota AI. „Nach unserem Gesamtsieg beim NVIDIA Nemotron Hackathon freuen wir uns, unsere Forschungsergebnisse auf dem ICML 2026 AdaptFM Workshop zu präsentieren. Wir werden weiterhin Optimierungstechnologien entwickeln, die einen effizienteren und praktischeren Einsatz großer KI-Modelle ermöglichen."

Darüber hinaus wird Nota AI während der ICML 2026 im COEX in Seoul die „Nota AI – Korea Efficient Days" veranstalten. Die Veranstaltung bringt globale Forscher, Ingenieure und Führungskräfte aus der Wirtschaft zusammen, die Korea besuchen, um Forschungstrends und industrielle Anwendungen von Efficient AI auszutauschen. Im Rahmen der Veranstaltung plant Nota AI, seine Forschungsergebnisse zur Optimierung groß angelegter KI-Modelle vorzustellen und Möglichkeiten für technische Zusammenarbeit und geschäftliche Kontakte zu erweitern.

Cision View original content to download multimedia:https://www.prnewswire.com/de/pressemitteilungen/nota-ai-hat-zwei-beitrage-zur-moe-quantisierung-fur-den-icml-2026-workshop-eingereicht-und-beweist-damit-seine-weltweite-wettbewerbsfahigkeit-bei-der-optimierung-groW-angelegter-ki-projekte-302798010.html


Knappes Votum, weitreichende Folgen: Schweiz dreht Schraube beim Zivildienst an

Die Schweizer Stimmberechtigten haben einer Verschärfung des Zivildienstgesetzes zugestimmt. Laut definitiven Ergebnissen votierten 52,5 Prozent für die Reform, rund 47,5 Prozent dagegen. Damit setzte sich der Kurs von Bundesrat und Parlament durch, den Zivildienst wieder klar als Ausnahme...

Read more


Schweiz stimmt über Bevölkerungsdeckel ab – Freizügigkeit mit der EU unter Druck

In der Schweiz entscheiden die Stimmbürgerinnen und Stimmbürger am Sonntag über eine weitreichende Begrenzung der Bevölkerungszahl. Zur Abstimmung steht eine Volksinitiative der rechtskonservativen Schweizerischen Volkspartei (SVP), die den Bestand des Landes bis 2050 auf höchstens zehn...

Read more


Finanzkrise in Wetzikon: Gericht gewährt GZO ein halbes Jahr Aufschub

Das GZO Spital Wetzikon erhält für seine Sanierungsbemühungen mehr Zeit: Das zuständige Nachlassgericht hat die definitive Nachlassstundung letztmals um sechs Monate bis zum 19. Dezember 2026 verlängert. Damit reagiert das Gericht auf ein Übernahmeangebot, das dem Spital Ende März zugegangen...

Read more


Biomarker im Speichel: Zürcher Studie ebnet Weg zu Schnelltest gegen Übermüdung

Forschende der Universität Zürich (UZH) haben einen Ansatz entwickelt, mit dem sich akuter Schlafmangel im Speichel nachweisen lässt. In einer aktuellen Studie identifizierte das Team um Thomas Krämer vom Institut für Rechtsmedizin eine Art metabolischen Fingerabdruck, der starke Übermüdung...

Read more


Zuwanderung, Wohnungsnot, Arbeitskräfte: Schweiz stimmt über Bevölkerungslimit ab

Die Schweiz stimmt an diesem Wochenende über eine der umstrittensten Initiativen der vergangenen Jahre ab: „Keine 10-Millionen-Schweiz!“. Der Vorstoß der nationalkonservativen Schweizerischen Volkspartei (SVP), auch bekannt als Schweizerische Volkspartei oder Swiss People's Party, sieht vor,...

Read more