Microsoft Agent Hackathon 挑戦の軌跡

4リアクション

はじめに

先日、下記のハッカソンに挑戦してみました！

https://zenn.dev/hackathons/microsoft-agent-hackathon-2026?tab=overview

Microsoft Agent Hackathon powered by Tokyo Electron Device

AIエージェントの技術で日本の業務課題を解決するハッカソン。Microsoft Azure × AIで、ビジネスの未来を切り拓こう。

zenn.dev

結果は下記の通りでした。

画像1.png 54.49 KB
できることはやったのですが、壁は高いですね...
実際にファイナリストを見ると、技術の選定から、実装して実際に動かすこと、インパクト、着眼点などまだまだ背中が遠いことを痛感します。

とはいえ、やってみてわかったこともあるので、初心者の軌跡として同じような方の挑戦の礎になれば位幸いです。
(もしハッカソン経験者の方がいらっしゃれば是非ご知見頂けると幸いです！)

第1章そもそもなぜ出たのか

経理マンで単体・連結決算担当者の筆者から見ると、世に出ているAI会計ツールのほとんどがせいぜい「単純仕訳を自動化する」か「FAQ bot を作る」かのどちらかです。

ただ、経理の現場で本当に人を疲弊させているのはそこではありません。

「この修正を入れると、親会社の資本剰余金と子会社の持分がずれる」——という連鎖の予測。「3期前の担当者がなぜ少数株主持分を×で処理したのか」——という判断の連続です。
ミスが修正を呼び、修正が残業を呼び、残業がミスを呼ぶ。判断するための認知の余力が残る構造になっていないのに、それでもやるしかない。
こうした負のループが心底嫌です。今も嫌です。
top of topはKPMGなどのコンサル会社も交えて大規模なAI判定にも着手しているようですが、そうではない99%は地道な判定に苦労しているはずです。

ならば、作るしかない。と思いました。

第2章実際に作ったものと回顧録

作ったのは ConDuctor（コンダクター）という連結決算検証型マルチエージェントです。

ダッシュボード

image.png 45.82 KB

関係会社各社の情報(※モックです)

image.png 29.27 KB

ナレッジ管理(過去にどうしてそのような判断をしたか？)

image.png 43.17 KB

・5体のエージェントが合議する

Controller（統括）
├── Verifier Alpha（数値番人 — 86ルール決定論検証）
├── Verifier Beta（連結整合 — 消去仕訳・持分法チェック）
├── Verifier Gamma（リスク意味論 — 異常パターン検出）
└── Quartermaster（照合・問合せメール生成）

単一エージェントではなく5体にした理由は明確です。連結決算に会計基準という「定石」はあっても「正解」はありません。同じパッケージを3人のベテランが見ると、3通りの指摘が出ます。この意見の割れ自体が情報であり、合議ログに残すべき知識だと判断しました。

・86ルールと書いていないことはやらない原則

検証ルールは86本。すべて `conductor_rules.xlsx` に定義し、LLMはそのルール以外の判断を下しません。すべての判定に `rule_ref: "R001"` というルールIDが付き、どの根拠でフラグを立てたかを完全追跡できます。

LLMに自由に判断させると、連結決算では困ります。投資と資本の相殺にだいたい合ってるからOKは存在しません。四半期ごとに、LLMの期限で判断が変わってしまっては論外です。

・Append-Only の監査証跡

すべての判定・修正・承認はAppend-Only DBに書き込まれ、物理削除も上書きもできない設計にしました。去年の担当者がなぜその判断を下したか、5年後でも読み返せます。
監査法人の担当会計士が替わっても、経理担当者が替わっても、知が残ることを重視しています。

これがConDuctorのコアです。

・技術スタックの反省と、斬新さに欠けた点

技術スタックは「Azure + Semantic Kernel」としました。
Microsoft Agent Hackathon だから Azure を選ぶのはある種当然です。Semantic Kernel の Plugin アーキテクチャも合理的な選択だったと思います。

ConDuctor は連結決算という専門ドメインに特化しているので差別化はできているはずでしたが、技術選定の面でのインパクトや革新性は最後まで出せなかったと思います。
そこは助言いただいた会計士にも「インパクトほしいね」と言われていたものの、最後まではまるピースを見つけられませんでした。

・「なぜLLMでなければならないか」に答えられなかった

ConDuctor の核は86ルールの決定論検証です。ルールベースで判定が終わるなら、LLMは本当に必要でしょうか。

この問いへの回答が弱かったです。実際には「意見の割れを合議ログとして記録する」「異常パターンの意味解釈」「問合せメールの自然言語生成」の3点でLLMが不可欠ですが、それを即答できる形に整理できていませんでした。

審査員に「それ、ルールベースだけでよくない？」と突かれたら詰まる構造になってしまっていました。経理とAIの交差点を見抜く力が不足していました。

・審査員が5分で体感できるゴールがなかった

「あなたの連結決算のこの問題が5分で解決される」というゴールが見えませんでした。Excelをアップロードして検証結果が返ってきて、それで何が変わるのか——の体感ルートを設計しきれていませんでした。
やはり、業務課題解決のインパクトをいかにわかりやすい形で落とし込むか、ができていませんでしたね...。

課題・反省点だらけですが、それでも挑んだことに後悔はありません。

おわりに

周りのレベルの高さを痛感し、力不足を感じることばかりでしたが、ハッカソンを完走できたのは大きな自信になりました。
バックオフィス界に革命を起こすには、まだまだやらなければならないことがたくさんあるうえ、先を走っている先達もたくさんいらっしゃいます。
それでも諦めず、Babystepsで進んでいきたいですね。
それまでAIが待ってくれるのかはわかりませんが。

参考:

詳細は下記ページに書いてます。興味がある方はぜひご一読ください。

https://zenn.dev/majiro_ns/articles/conductor-spring-death-march

人は替わる。知は残る。——5体のAIエージェントで「春のデスマーチ」を終わらせる

Majiroさんによる記事

zenn.dev

このブログ一覧は

メンバー投稿記事

です

メンバー登録すると、限定記事の閲覧やメンバー同士の交流、限定イベントへの参加などができます。

CDLEコミュニティサイトβ版

JDLA（一般社団法人日本ディープラーニング協会）が実施する、G検定・E資格の合格者のみが参加できる、10万人を超える日本最大級のAIコミュニティ「CDLE」の紹介サイトです。 CDLEでは、ディープラーニングの社会実装の日本代表として、社会を発展させるエバンジェリストたちが集まり、学び合い・アウトプットする場を提供しています。

詳細を見る

CDLEメンバー

¥55/月(税込)

登録情報を確認の上、事前登録された方へ本登録のご案内メールを送信します。もっとみる閉じる

登録情報を確認の上、事前登録された方へ本登録のご案内メールを送信します。

このプランに入会する

その他のプランもみる

4リアクション

メンバーの方はこちらからログイン

AIからの叱責はモチベーションを促すか？ ─ 感情なき声が、人を動かすとき ─

ド素人が挑む低コストフィジカルAI【入門編】