Office Agent – „Taste driven“ multiagentní systém pro Microsoft 365 Copilot
Zjistěte, jak Office Agent nově pojímá tvorbu obsahu díky „taste-driven“ přístupu k návrhu a přináší uhlazené, profesionální výsledky.
Microsoft dnes představuje Office Agent – multi-agentní systém, který staví na open-source stacku, modelu Claude od Anthropic a novém přístupu taste-driven development (TDD). Výsledkem jsou vyladěné PowerPoint prezentace, hotové Word dokumenty a brzy také Excel tabulky.
Systém řídí sadu specializovaných agentů, kteří dokážou Office výstupy naplánovat, vytvořit a postupně doladit od začátku do konce. Office Agent je postavený na univerzální agentní architektuře a ověřený na špičkových benchmarcích; dlouhodobě dosahuje state-of-the-art výsledků a potvrzuje, že zvládá i složité workflow spolehlivě a ve vysoké kvalitě.
Výsledky reportované v GAIA

Oficiální metriky uváděné dodavateli AI. Manus: 10. března 2025; Genspark: 25. dubna 2025; OpenAI DR: 2. února 2025.
Poznámky: L1, L2 a L3 označují testovací dotazy s rostoucí obtížností – od nejjednodušších po nejtěžší.
Design – orchestrace multi-agent systému s využitím open source
Základem Agent je multi-agent orchestration engine:
- Central planner agent řídí úkoly a skládá výsledky do jednoho výstupu
- Specialized agents (pro kód, finance, vyhledávání a další) běží paralelně
- Secure tool layer napojuje nástroje a sandboxovaná prostředí
Office Agent staví na inovacích open-source komunit a přináší koordinované agentní workflow s výkonem a spolehlivostí, které potřebujete pro každodenní práci.

Taste-Driven Development (TDD)
Skutečná hodnota je ve výstupech, které vypadají profesionálně a jsou rovnou použitelné. Většina AI agentů dnes vytváří prezentace tak, že jen vygeneruje „surový“ kód – výsledkem bývá nevyrovnané rozvržení, přeplácané vizuály a následně několik kol ručních oprav.
Office Agent proto přichází s novým přístupem: Taste-Driven Development (TDD):
- Znovupoužitelné “taste blueprints” odvozené z kvalitního interního obsahu, který Microsoft dlouhodobě nasbíral
- Konzistentní designový jazyk napříč slidami i dokumenty
- Výstupy, které jsou připravené k použití a zároveň vizuálně dotažené
Díky TDD Agent nastavuje vysokou laťku pro AI generovaný obsah – zejména pokud jde o estetiku a layout. Na příkladu generování PPT: v rámci TDD začíná tvorba „vkusné“ prezentace krokem taste distillation. Microsoft analyzuje velkou sadu kvalitních ukázek prezentací a z nich vytěží podkladové taste blueprints. Tato destilovaná znalost se pak promítne přímo do plánování a realizace, takže ovlivňuje rozvržení, styl i generování obsahu.
Workflow běží v iterativní smyčce. Každý vygenerovaný výstup nejdřív projde modulem pro self-verification obsahu, který hodnotí kvalitu i „taste“. Zpětná vazba se vrací agentovi, aby mohl výsledek sám iterovat a postupně vyladit.
Finálním výstupem je sada slidů postavených na HTML5, které kombinují výrazný design se striktní strukturou. Pro maximální použitelnost je k dispozici i konverzní nástroj, který tyto HTML5 slidy automaticky převede do formátu PowerPoint, abyste je mohli dál upravovat v Microsoft PowerPoint.

Ukázky procesu a výstupů Office Agent:
Přednáška o neuronových sítích [Celý záznam] Prompt: Mám přednášku o neuronových sítích — můžete mi pomoct s výukovými slidami?
Trendy budoucnosti práce [Celý záznam] Prompt: Vytvořte prezentaci, která shrne 5 nejdůležitějších globálních trendů formujících budoucnost práce (např. adopce AI, práce na dálku, nábor podle dovedností). Jako zdroj dat použijte Microsoft WorkLab
Vývoj kávové kultury [Celý záznam] Prompt: Vytvořte slidy o vývoji kávové kultury
Posun k odolnosti v supply chain [Celý záznam] Prompt: Ukažte globální posun od efektivity k odolnosti v enterprise strategii supply chain. Použijte elegantní mapy světa, grafiku časové osy a vytříbené patkové nadpisy na tlumených pozadích.

Auto theming pro špičkový výstup:
Přednastavené themes byly dlouho výchozí volbou pro každého, kdo připravuje prezentace. Nabízejí sice rozmanitost, často ale na úkor přesnosti. Vychází se z předpokladu, že čím víc možností, tím lépe – že když uživatelé projdou dostatek šablon, nakonec narazí na tu správnou. V praxi to ale často nefunguje. Uživatelé nechtějí donekonečna rolovat seznamem designů; chtějí něco, co s citem odpovídá jejich obsahu.
Proto Microsoft navrhl auto theming. Místo toho, aby si uživatelé vybírali z předem daných templates, auto theming si přečte samotný obsah a vygeneruje design, který k němu přirozeně sedí. Výsledkem není „další theme“, ale theme, který se hodí přesně pro daný účel.
Ukázky: Pokémon Cultural, Butterflies For 1st Grades, Black Myth, Bauhaus Movement

Ladění „taste“ pod vedením expertů
I když TDD zvedá základní úroveň kvality, lidský úsudek je do systému zabudovaný už od samotného návrhu. Během vývoje designéři formovali „taste“ tím, že procházeli a upravovali ukázkové případy a vybírali z nich nejsilnější vzory. Tyto poznatky se pak přetavily do style rules, které Agent používá za běhu – díky tomu výstupy odpovídají zadání na vyšší úrovni a ve velkém měřítku působí konzistentně a dotaženě.

TDDEval
Aby Microsoft vyhodnotil užitečnost generovaných výstupů napříč PowerPointem, Excelem a Wordem, vznikl benchmark navržený přímo pro taste-driven generování: TDDEval. Na rozdíl od univerzálních benchmarků TDDEval lépe pokrývá reálnou šíři znalostní práce – zahrnuje široké spektrum testovacích úloh. Součástí jsou typické, vysoce hodnotné scénáře jako „Vytvořte PPT s business plánem“, „Vygenerujte rozpočtovou predikci v Excelu“ a „Napište formální report ve Wordu“. Nechybí ani okrajové případy, které prověřují odolnost systému: od velmi otevřených zadání až po striktně specifikované analytické požadavky.
Kvalita se měří ve dvou rovinách:
- Content Quality – Hodnocení faktické správnosti a strukturální integrity výstupů, včetně (a) opory ve zdrojových materiálech, (b) relevance k tématu, (c) úplnosti pokrytí, (d) logické struktury a (e) praktické použitelnosti.
- Taste Score – Zachycení estetické a „uživatelské“ stránky, včetně (a) vizuální atraktivity, (b) layoutu a organizace, (c) typografické kvality, (d) konzistence designu a (e) výběru vizuálních assetů.
Tyto dvě osy dohromady dávají celkový obrázek: říká výstup správné věci a zároveň vypadá a působí natolik profesionálně, že ho můžete hned použít? Tím, že TDDEval kvantifikuje jak obsah, tak styl, nastavuje vyšší laťku toho, co v kontextu AI generovaného produktivního obsahu znamená „kvalita“.
Poznatky
Při vývoji a testování Office Agent Microsoft nasbíral řadu poznatků, které ovlivnily jeho návrh i výsledný výkon. Ukazují, co je v praxi potřeba, aby agentní systémy byly spolehlivé, přesné a skutečně užitečné v reálných scénářích produktivity.
Poznatek 1 – Kdy je lepší obecné spouštění kódu než nástroje pro konkrétní úlohy
Nástroje zaměřené na konkrétní úlohy fungují dobře u předvídatelných a opakovatelných scénářů. Obecný agent ale potřebuje flexibilitu a schopnost zobecňovat napříč různými typy volání nástrojů. Aby Office Agent dosáhl vysoké kvality jako general-purpose agent, staví na code-first přístupu – model může psát a spouštět kód (např. pro přepis MP3 nebo extrakci textu z PDF) místo toho, aby se spoléhal na úzce specializované nástroje. Task-specific tools (byť bývají předvídatelnější a lépe kontrolovatelné) mohou omezovat flexibilitu a zhoršovat schopnost agenta zobecňovat.
Díky tomu zůstává agent general-purpose – spíš jako full-stack developer než úzce natrénovaný „řešič“ jedné konkrétní úlohy.
Poznatek 2 – Self-validation zvyšuje přesnost
U složitých nebo vícekrokových úloh je důležité, aby agent průběžně ověřoval postup a sám posuzoval správnost – právě to výrazně zvyšuje přesnost.
- Microsoft vede model k tomu, aby si znovu formuloval původní zadání a porovnal ho s aktuálním výstupem, aby bylo jasné, že je stále „na stejné vlně“.
- Vkládání průběžných kontrolních bodů zvyšuje spolehlivost, zejména u úloh vyžadujících přesnost, filtrování nebo syntézu z více zdrojů.
- Human-in-the-loop: Z pohledu uživatelské zkušenosti mohou uživatelé požádat Office Agent, aby zkontroloval výsledky provedení nebo vygenerované artefakty a ověřil, zda obsah odpovídá jejich očekáváním; případně mohou vyžádat další úpravy.
Poznatek 3 – Browsing jako člověk, ne jen „stažení obsahu“
Browser tools by měly umožnit navigaci po webu podobně jako člověk, ne jen scrapování stránek.
- Nestačí vytáhnout „syrový“ obsah stránky – agent musí umět procházet web jako člověk.
- Model je vhodné vést k tomu, aby 1) klikal na odkazy, stránkoval a scrolloval dlouhé stránky, 2) bral každou akci v prohlížení jako součást souvislé cesty za informacemi.
- Všechna průběžná pozorování je potřeba promítat do průběžně se vyvíjejícího kontextu, aby agent lépe uvažoval.
- Pro zkrácení dlouhého obsahu efektivně použijte sumarizaci pomocí LLM – zachová klíčové detaily a zároveň šetří „paměť“.
Poznatek 4 – Vkládání znalostí ukotvených v preferencích vede k lepšímu provádění úloh
LLM mají široké znalosti o světě, ale často jim chybí preference pro konkrétní typy úloh, pokud je k nim explicitně nevedete. Když do systému doplníte předchozí znalosti nebo preferované volby (např. „pro zpracování .docx používejte python-docx“), agent rychleji zvolí optimální postup provedení, což zvyšuje konzistenci i kvalitu výběru nástrojů. Takové vedení zároveň snižuje halucinace, protože rozhodování směřuje k ověřeným a spolehlivým postupům.
Co bude dál
Office Agent se dnes začíná postupně zpřístupňovat předplatitelům Microsoft 365 Personal, Family a Premium v rámci programu Frontier; podpora pro Commercial je na cestě. Office Agent je nástroj typu „zero-to-one“ – umí od nuly vytvářet kvalitní výstupy podložené rešerší – zatímco Copilot v PowerPointu, Wordu a Excelu zůstává expertem přímo v aplikaci a pomáhá uživatelům obsah dolaďovat, upravovat a dál rozvíjet v rámci jednotlivých aplikací. Společně se přirozeně zapojují do toho, jak lidé reálně pracují. Více informací najdete v oznamovacím blogu.
Tohle je teprve začátek. Microsoft posouvá orchestraci agentů, rozšiřuje taste libraries a prohlubuje integraci napříč ekosystémem Microsoftu. Agentic systémy nepomáhají jen s jednotlivými úkoly – mění způsob, jak se ve velkém vytváří, ladí a dokončuje znalostní práce. Začněte tady.
Tento článek vznikl s využitím materiálu z techcommunity.microsoft.com. Osobní postřehy a komentáře jsou moje vlastní.