Was ist Microsoft Foundry — und warum heißt es ständig anders?
Microsoft Foundry ist Microsofts zentrale KI-Plattform für Modelle, Agenten und deren Governance — und sie hieß in zwei Jahren dreimal anders: Azure AI Studio wurde im November 2024 zu „Azure AI Foundry", im November 2025 zu „Microsoft Foundry". Der technische Unterbau ist derselbe. Wer also Dokumentation, Angebote oder Blogartikel mit drei verschiedenen Namen findet: Es ist dasselbe Produkt in drei Lebensphasen.
Praktisch relevant ist vor allem eins: Bestehende Azure-OpenAI-Ressourcen lassen sich zu Foundry-Ressourcen upgraden, Endpoints und Keys bleiben dabei erhalten. Wer vor zwei Jahren mit Azure OpenAI gestartet ist, steht also nicht vor einem Neuanfang, sondern vor einem Upgrade-Pfad.
Heute ist Foundry eine Multi-Model-Plattform — OpenAI, Anthropic, Mistral, DeepSeek, Microsofts MAI-Familie und mehr, mit einem Model Catalog von über 11.000 Modellen. Dazu kommen die Foundry Control Plane als zentrale Governance-Ebene (nativ integriert mit Entra, Purview und Defender), Agent 365 für die Agenten-Verwaltung und Unterstützung für offene Standards wie MCP und Agent-to-Agent (A2A).
Welche Bausteine gehören zu einem vollständigen MS-KI-Stack?
Vier Ebenen, eine Klammer: Datenfundament (Fabric/OneLake), Modell- und Inferenz-Ebene (Foundry), Anwendungs-Ebene (Copilot, Power Platform, eigene Apps) — und darüber die Governance-Klammer aus Entra, Purview und Defender. Wer nur die Anwendungs-Ebene kauft und den Rest ignoriert, baut KI auf Sand.
| Ebene | Produkt | Aufgabe |
|---|---|---|
| Datenfundament | Microsoft Fabric / OneLake | Daten zusammenführen und aufbereiten — die Qualität der KI beginnt hier |
| Modell & Inferenz | Microsoft Foundry | Modelle auswählen, betreiben, orchestrieren (11.000+ Modelle im Catalog) |
| Anwendung | M365 Copilot, Power Platform / Copilot Studio, eigene Apps | KI in die Arbeitsabläufe bringen |
| Agenten-Verwaltung | Agent 365 / Foundry Control Plane | Agenten inventarisieren, steuern, beaufsichtigen |
| Governance-Klammer | Entra, Purview, Defender | Identität, Datenklassifizierung, Sicherheit — über allem |
Das unterschätzte Element ist Purview: Datenkatalogisierung, Sensitivity Labels und Compliance-Kontrollen über die gesamte Pipeline — bis hin zu eDiscovery für Copilot-Prompts und -Antworten. Purview ist kein „Compliance-Add-on", sondern das Fundament, auf dem jede KI-Nutzung im Stack auditierbar wird. Wer es einführt, bevor die ersten Agenten laufen, spart sich die schmerzhafte Nachrüstung.
Wie verhindert man Wildwuchs bei Power Platform und Agenten?
Power Platform und Copilot Studio machen jeden Fachbereich zum Agenten-Bauer — Low-Code plus KI. Ohne Governance entsteht damit die nächste Shadow-IT-Generation: Citizen Developer, die produktive Automatisierungen bauen, von denen die IT nichts weiß. Das Muster kennen wir bereits von der Shadow AI — nur dass diesmal nicht Tools genutzt, sondern Systeme gebaut werden.
Die Antwort ist dieselbe wie dort: nicht verbieten, sondern kanalisieren. Klare Umgebungs-Strategien (wo darf experimentiert werden, was braucht Freigabe), Agenten-Inventar über Agent 365 bzw. die Foundry Control Plane, und Purview-Labels, die regeln, welche Daten ein selbstgebauter Agent überhaupt sehen darf. Citizen Development ist eine Stärke des Stacks — aber nur mit Leitplanken, die von Anfang an mitlaufen.
Was kostet der Betrieb wirklich?
Die wichtigste Stellschraube heißt PTU: Provisioned Throughput reserviert dedizierte Kapazität und lohnt sich als Faustregel ab etwa 1.800 € Token-Kosten pro Monat — oder wenn harte Latenz-Anforderungen bestehen. Für Piloten ist Pay-as-you-go der richtige Einstieg. Wer DSGVO-Anforderungen an den Verarbeitungsort hat, nutzt Data Zone Deployments.
Die Kostenlogik des Stacks belohnt Planung: Piloten klein und verbrauchsbasiert fahren, Nutzung messen, und erst beim nachgewiesenen Dauerbetrieb auf reservierte Kapazität wechseln. Der häufigste Fehler ist der umgekehrte Weg — groß dimensionieren, bevor klar ist, welche Use-Cases überhaupt tragen. Die ehrliche Betriebsrechnung umfasst außerdem das, was nicht auf der Azure-Rechnung steht: Governance-Pflege, Schulungen und die Person, die das Agenten-Inventar tatsächlich führt.
Wo sind die Grenzen des Microsoft-Stacks?
Die strukturelle Grenze ist ehrlich benannt schnell gefunden: Auch der vollständige Microsoft-Stack ist Cloud. Für Berufsgeheimnisträger nach §203 StGB und für Daten, die das Haus grundsätzlich nicht verlassen dürfen, bleibt lokale KI die strukturelle Antwort. Für diese Fälle bauen wir Sovereign-AI-Infrastrukturen — das ist aber die Ausnahme-Ebene, nicht das Gegenargument zum Stack.
Für alles andere gilt: Wer Microsoft-Verträge bezahlt, hat bereits eine KI-Plattform mit Datenfundament, Multi-Model-Zugang und integrierter Governance im Haus. Die Frage ist nicht, ob man sie nutzt — sondern ob man sie mit Plan nutzt. Welcher Use-Case auf welche Ebene gehört, wo Copilot reicht und wo es mehr braucht, und wie die Governance-Klammer von Tag eins mitläuft — das ist die eigentliche Architekturarbeit. Sie entscheidet, ob aus den bezahlten 100 % genutzte 80 % werden oder es bei 20 % bleibt.