Vytváření režimu Agent v Excelu
Excel je celosvětově nejdůvěryhodnější prostředí pro práci s daty – od domácích rozpočtů přes společnosti z žebříčku Fortune 500 až po vědecký výzkum…
Excel je pro práci s daty nejdůvěryhodnější „plátno“ na světě – používá se na všechno od domácích rozpočtů přes firmy z Fortune 500 až po vědecký výzkum, provozní plánování nebo výuku ve školách. Právě tady miliony lidí přemýšlejí, plánují a tvoří. Agent Mode posouvá tenhle dopad ještě dál: zpřístupňuje expertní možnosti a dělá pokročilou analýzu, modelování i automatizaci použitelnou pro každého napříč obory.
V Agent Mode popíšete úkol přirozeným jazykem a nástroj s Vámi pak společně plánuje postup, uvažuje nad řešením, iteruje a ověřuje výsledek. Po uvedení Copilot in Excel bylo rychle vidět, že uživatelé chtějí víc – hlubší vhledy a hlavně přímé akce přímo v listu. Agent Mode má tyto očekávání naplnit robustním způsobem, který funguje napříč různými typy dat i scénáři a umí dělat smysluplné změny přímo ve Vašem workbooku.
Microsoft Agent Mode navrhl tak, aby využil plnou „bohatost“ excelových artefaktů – včetně struktur tabulek, syntaxe vzorců, dynamic arrays, PivotTables, grafů a dalších prvků. Umí vytvářet workbooks, které jsou refreshable, auditable a verifiable. Tenhle posun stojí na zlepšeních v reasoning engine a na tom, že Excel jde vyjádřit jako bohatý modelovací jazyk. Díky tomu Agent Mode nejen generuje a spouští řešení, ale také vyhodnocuje výsledky, opravuje problémy a opakuje postup, dokud není výsledek ověřený.
Agent Mode Microsoft vyhodnotil na kompletní sadě 912 instrukcí z SpreadsheetBench a dosáhl přesnosti 57,2 %. V testovacím prostředí Agent Mode provádí přímé úpravy workbooku přes Excel APIs v JavaScript runtime. Přesnost se měří pomocí skriptu od autorů SpreadsheetBench, který hodnotí výstup s využitím open-source knihovny openpyxl. Pro vyhodnocení u Claude a Shortcut.aI Microsoft úlohy SpreadsheetBench spouštěl ručně (včetně informací o umístění odpovědi potřebných pro spolehlivé hodnocení) a stáhl vytvořené Excel soubory. Tyto stažené soubory pak byly ohodnoceny stejným hodnoticím skriptem od autorů SpreadsheetBench. U vyhodnocení s Claude se podařilo dokončit 895 z 912 instrukcí. Čísla přesnosti byla spočítána pouze z dokončených úloh. Všechny benchmarkové výsledky OpenAI byly původně publikovány OpenAI zde.Microsoft Agent Mode měří jak na interních evaluačních sadách, tak na veřejném benchmarku SpreadsheetBench. Výsledky na SpreadsheetBench řadí Agent Mode na špičku současných systémů – správně dokončí 57,2 % úloh v benchmarku.
Microsoft ale zdůrazňuje, že cílem není „ladit na benchmarky“, ale řešit reálnou práci uživatelů v Excelu. To znamená zvládat nepořádek v datech, nejednoznačné zadání i složité úkoly tak, jak se s nimi lidé v praxi potkávají. A i když je SpreadsheetBench silný signál, nepokrývá všechno, co dělá Excel výjimečným – například dynamic arrays, PivotTables, grafy nebo formátování – ani potřebu zákazníků mít řešení refreshable, auditable a verifiable. Proto Microsoft vybudoval také interní evaluační sady, AI grading a zpětnovazební smyčky od uživatelů, které další zlepšování řídí.
Microsoft zároveň přiznává, že je stále co zlepšovat – zejména v oblasti formátování a rozvržení, které má vypadat „prezentačně“. Základ je ale podle Microsoftu pevný a směr jasný: Agent Mode má udělat Excel výkonnější, intuitivnější a užitečnější než kdy dřív.
Návrh inteligentního spreadsheet agenta
Jádrem Agent Mode je smyčka pro uvažování a reflexi — postavená na nejnovější generaci pokročilých reasoning modelů — která umí pracovat přímo s Excel workbooks. Místo toho, aby systém hned „něco udělal“, nejdřív z daného workbooku připraví kontext ve formátu vhodném pro model a pomocí pokročilého reasoning modelu začne plánovat postup pro konkrétní úkol. Následně s workbookem pracuje tak, že zapisuje a spouští kód, kterým plán realizuje, vyhodnocuje výsledky a kontroluje, jestli odpovídají původnímu záměru. Pokud něco nesedí, smyčka pokračuje: upraví strategii, doplní další kontext a zkouší alternativní přístupy. Tento cyklus plánování, provedení a reflexe běží tak dlouho, dokud systém nevyhodnotí, že je úkol hotový. Díky kombinaci plánování a schopnosti reagovat na průběžné výsledky si agent umí vytyčit cestu, podle potřeby ji upravit a nakonec dodat řešení, které působí promyšleně a cíleně.
Reasoning engine v architektuře je záměrně model-agnostic, takže lze rychle integrovat nové modely, jakmile jsou k dispozici. Volnější provázání mezi vrstvou pro reasoning a vrstvou pro interakci s workbookem umožňuje nové modely snadno vyměňovat a průběžně vyhodnocovat.
Přehled architektury systému Agent Mode.Správa kontextu sešitu
Sešity v Excelu jsou živé systémy. Často bývají velké, průběžně se mění a obsahují spoustu „bohatých“ objektů, jako jsou PivotTables, slicers nebo grafy. Pro agenta je nereálné snažit se nasát všechny detaily najednou. Kdybyste do kontextu poslali celý dataset včetně metadat ke každému objektu, zahltí to jakýkoli dnešní model. A ani zpřístupnit tisíce read API, které Excel nabízí, není rozumná cesta – je to zbytečně těžkopádné. Agent proto k sešitu přistupuje strategicky: načítá si jen ty části kontextu, které zrovna potřebuje, a postupně se prokousává složitostí krok za krokem. Díky tomu není jen pasivním „zpracovatelem“ dat, ale aktivně prozkoumává, jak Váš sešit funguje uvnitř.
Aby takové selektivní prozkoumávání fungovalo, Microsoft vyvinul Document Context Producer, který běží v koordinovaném push-and-pull režimu. V části „push“ Document Context Producer proaktivně pošle spolu s promptem uživatele kompaktní „blueprint“ sešitu – souhrn rozložení, hodnot, objektů a grafu závislostí vzorců – přičemž složitější objekty kóduje do JSON a tabulková data do Markdown. Když je potřeba jít víc do hloubky, reasoning engine si pak může vyžádat a „pull“ způsobem dotáhnout další informace podle potřeby, takže má vždy k dispozici kontext, se kterým může efektivně pracovat.
Tento hybridní návrh vyvažuje úplnost a efektivitu a zároveň vytváří základ pro další vylepšení v oblasti caching, indexing a search, která zrychlí a zpřesní získávání kontextu.
Náš Document Context Producer převádí složité sešity do kontextu připraveného pro model.Jak dostat do Agent Mode znalost Excelu
Správa kontextu dává agentovi jasný přehled o sešitu. Další výzvou je ale samotná akce: vědět, kterou z tisíců funkcí a API v Excelu použít, aby se úkol opravdu dokončil.
Excel má tisíce API ovládacích prvků – od vzorců přes objekty až po pokročilé funkce. Je to plocha tak velká, že si ji žádný současný model nemůže „zapamatovat“ ani přímo řídit. Místo snahy tuhle komplexitu hrubou silou obejít Microsoft zabudoval do reasoning enginu zhuštěnou dokumentaci – kompaktní, strukturovaný referenční přehled funkcí, objektů a specializovaných tool calls v Excelu. Agent Mode pak z těchto destilovaných znalostí čerpá při pokročilých úlohách, jako je tvorba PivotTables, grafů, slicers nebo finančních modelů.
Tím, že se do modelu vloží jen to podstatné, získá „expert-level“ orientaci ve vnitřním fungování Excelu, aniž by se zahltilo jeho kontextové okno. Výsledkem je přesnější uvažování napříč celou sadou funkcí aplikace.
Generování řízené validací
Při vývoji a vyhodnocování klíčové smyčky pro psaní kódu a reflexi Microsoft zjistil, že řada chyb v tabulkách je „tichá“ – vzorce sice vrací hodnoty, ale drobné omyly zůstávají skryté, dokud se neprojeví v navazující analýze. Spoléhat se na jediný krok spuštění je proto riskantní, pokud má být automatizace důvěryhodná.
Proto Agent Mode v Excelu pojímá každý tool call jako auditovatelný a ověřitelný workflow. Než se provede akce, reasoning engine nejdřív vygeneruje jednoduché testy, které stanoví očekávané výsledky. Tyto kontroly fungují jako ověřitelné „guardrails“ – každý krok lze zkontrolovat a znovu reprodukovat. Důležité je, že místo natvrdo zadaných hodnot Agent Mode provádí všechny výpočty přímo v gridu. Tím se zachová kompletní struktura závislostí v sešitu a uživatelé mohou auditovat mezivýsledky, sledovat vzorce a ověřovat správnost v každé fázi.
V kvantitativních evaluacích Microsoftu tento přístup s průběžnou validací přinesl zlepšení přesnosti v řádu desítek procentních bodů.
Ilustrační příklad přístupu s průběžnou validací: v řetězci uvažování Agent Mode je proloženo několik „testovacích“ kroků.Škálování kvality pomocí AI graders
S tím, jak Microsoft posouvá Agent Mode směrem k hluboce integrovanému a kontextově chytrému „parťákovi“ pro práci s daty, ukazují se AI graders jako jeden z nejdůležitějších technických stavebních kamenů pro kvalitu, důvěryhodnost a použitelnost. Nejsou to jen „kontroloři správnosti“ – nastavují laťku toho, co znamená dobrý výsledek. Hlídají, aby odpovědi nebyly jen správně, ale také praktické, kompletní, relevantní a příjemné na používání.
Graders jsou způsob, jak převést obecné cíle kvality do měřitelných a akčních standardů. V Agent Mode stojí jak za offline vyhodnocovacími pipeline, tak za metrikami živé uživatelské zkušenosti – a pomáhají odpovídat na otázky typu:
- Splnil Agent Mode záměr uživatele?
- Byl výstup přesný a ověřitelný?
- Působil výsledek jako přirozená součást Excelu?
- Byla zkušenost uspokojivá a dobře přístupná?
Bez graders by hrozilo, že se optimalizace zvrhne na povrchní metriky – třeba rychlost odpovědi nebo počet tokenů – a utečou signály, které skutečně ukazují, jestli uživatel uspěl.
Co bude dál
První preview Agent Mode v Excelu je ode dneška dostupné přes Frontier program pro zákazníky s licencí Microsoft 365 Copilot a pro předplatitele Microsoft 365 Personal, Family nebo Premium (v rámci Microsoft Services Agreement). Agent Mode funguje v Excelu na webu a brzy dorazí i na desktop. Pokud si ho chcete vyzkoušet, najdete Agent Mode v nabídce Tools u Copilot v Excelu. Více informací je v oznamovacím blogu.
Toto preview je teprve začátek. Microsoft dál pracuje na kompletním, s M365 integrovaném prostředí, které bude důvěryhodné, spolehlivé a transparentní – takové, na které se můžete opřít i u kritické práce. Z pohledu vývojářů Microsoft zároveň zkoumá možnosti rozšiřitelnosti, aby si zákazníci a partneři mohli nad možnostmi Agent Mode stavět vlastní řešení.
V následujících týdnech a měsících chce Microsoft tuto zkušenost plně integrovat a průběžně vylepšovat napříč všemi klienty Excelu. Pokračovat bude zvyšování kvality výstupů, ladění rozhraní Agent Mode v chatu i přímo v gridu a zapracování zpětné vazby tak, aby vše působilo jako „doma“ v Excelu – a zároveň to otevřelo úplně nové způsoby modelování, analýzy a automatizace.
Tento článek vznikl s využitím materiálu z techcommunity.microsoft.com. Osobní postřehy a komentáře jsou moje vlastní.