はじめに
先日、下記のハッカソンに挑戦してみました!
結果は下記の通りでした。
できることはやったのですが、壁は高いですね...
実際にファイナリストを見ると、技術の選定から、実装して実際に動かすこと、インパクト、着眼点などまだまだ背中が遠いことを痛感します。
とはいえ、やってみてわかったこともあるので、初心者の軌跡として同じような方の挑戦の礎になれば位幸いです。
(もしハッカソン経験者の方がいらっしゃれば是非ご知見頂けると幸いです!)
第1章 そもそもなぜ出たのか
経理マンで単体・連結決算担当者の筆者から見ると、世に出ているAI会計ツールのほとんどがせいぜい「単純仕訳を自動化する」か「FAQ bot を作る」かのどちらかです。
ただ、経理の現場で本当に人を疲弊させているのはそこではありません。
「この修正を入れると、親会社の資本剰余金と子会社の持分がずれる」——という連鎖の予測。「3期前の担当者がなぜ少数株主持分を×で処理したのか」——という判断の連続です。
ミスが修正を呼び、修正が残業を呼び、残業がミスを呼ぶ。判断するための認知の余力が残る構造になっていないのに、それでもやるしかない。
こうした負のループが心底嫌です。今も嫌です。
top of topはKPMGなどのコンサル会社も交えて大規模なAI判定にも着手しているようですが、そうではない99%は地道な判定に苦労しているはずです。
ならば、作るしかない。と思いました。
第2章 実際に作ったものと回顧録
作ったのは ConDuctor(コンダクター)という連結決算検証型マルチエージェントです。
ダッシュボード
関係会社各社の情報(※モックです)
ナレッジ管理(過去にどうしてそのような判断をしたか?)
・5体のエージェントが合議する
Controller(統括)
├── Verifier Alpha(数値番人 — 86ルール決定論検証)
├── Verifier Beta(連結整合 — 消去仕訳・持分法チェック)
├── Verifier Gamma(リスク意味論 — 異常パターン検出)
└── Quartermaster(照合・問合せメール生成)
単一エージェントではなく5体にした理由は明確です。連結決算に会計基準という「定石」はあっても「正解」はありません。同じパッケージを3人のベテランが見ると、3通りの指摘が出ます。この意見の割れ自体が情報であり、合議ログに残すべき知識だと判断しました。
・86ルールと書いていないことはやらない原則
検証ルールは86本。すべて `conductor_rules.xlsx` に定義し、LLMはそのルール以外の判断を下しません。すべての判定に `rule_ref: "R001"` というルールIDが付き、どの根拠でフラグを立てたかを完全追跡できます。
LLMに自由に判断させると、連結決算では困ります。投資と資本の相殺にだいたい合ってるからOKは存在しません。四半期ごとに、LLMの期限で判断が変わってしまっては論外です。
・Append-Only の監査証跡
すべての判定・修正・承認はAppend-Only DBに書き込まれ、物理削除も上書きもできない設計にしました。去年の担当者がなぜその判断を下したか、5年後でも読み返せます。
監査法人の担当会計士が替わっても、経理担当者が替わっても、知が残ることを重視しています。
これがConDuctorのコアです。
・技術スタックの反省と、斬新さに欠けた点
技術スタックは「Azure + Semantic Kernel」としました。
Microsoft Agent Hackathon だから Azure を選ぶのはある種当然です。Semantic Kernel の Plugin アーキテクチャも合理的な選択だったと思います。
ConDuctor は連結決算という専門ドメインに特化しているので差別化はできているはずでしたが、技術選定の面でのインパクトや革新性は最後まで出せなかったと思います。
そこは助言いただいた会計士にも「インパクトほしいね」と言われていたものの、最後まではまるピースを見つけられませんでした。
・「なぜLLMでなければならないか」に答えられなかった
ConDuctor の核は86ルールの決定論検証です。ルールベースで判定が終わるなら、LLMは本当に必要でしょうか。
この問いへの回答が弱かったです。実際には「意見の割れを合議ログとして記録する」「異常パターンの意味解釈」「問合せメールの自然言語生成」の3点でLLMが不可欠ですが、それを即答できる形に整理できていませんでした。
審査員に「それ、ルールベースだけでよくない?」と突かれたら詰まる構造になってしまっていました。経理とAIの交差点を見抜く力が不足していました。
・審査員が5分で体感できるゴールがなかった
「あなたの連結決算のこの問題が5分で解決される」というゴールが見えませんでした。Excelをアップロードして検証結果が返ってきて、それで何が変わるのか——の体感ルートを設計しきれていませんでした。
やはり、業務課題解決のインパクトをいかにわかりやすい形で落とし込むか、ができていませんでしたね...。
課題・反省点だらけですが、それでも挑んだことに後悔はありません。
おわりに
周りのレベルの高さを痛感し、力不足を感じることばかりでしたが、ハッカソンを完走できたのは大きな自信になりました。
バックオフィス界に革命を起こすには、まだまだやらなければならないことがたくさんあるうえ、先を走っている先達もたくさんいらっしゃいます。
それでも諦めず、Babystepsで進んでいきたいですね。
それまでAIが待ってくれるのかはわかりませんが。
参考:
詳細は下記ページに書いてます。興味がある方はぜひご一読ください。







