Y.Miyado

2026/04/05 20:30

NPUでローカルLLＭを動かす～Foundry Local利用

16リアクション

最近ではCopilot+ PC規格に対応したPCをお持ちの方も増えているかと思います。
Copilot+ PCとは40 TOPS以上の処理能力を持つNPU（Neural Processing Unit : ニューラル処理ユニット）を搭載した、AI特化型の次世代Windows 11 PCのことです。
Copilot+ PCではRecallとかライブキャプションなどの機能が利用できるのですが、これらの機能をあまり利用していない場合は持ち腐れになってしまいます。

自分のPCにもNPUが入っているのですが全然使っていないので、何かしらNPUを動かしてみたいと思いローカルLLMを使ってみることにしました。

NPUでローカルLLMを動かすには？

LLMを動かすソフトウェアが必要です。いくつか選択肢があり、たぶん一番手っ取り早いのはLM Studioですが、今回はMicrosoftが出しているFoundry Localを利用することにしました。

https://www.foundrylocal.ai/

Foundry Local - Run AI Models Locally with Complete Privacy

Run AI models locally on your device. Foundry Local provides on-device inference with complete data privacy, no Azure subscription required.

www.foundrylocal.ai

Foundry Localのインストール方法

コマンド１個打つだけです。簡単です。詳細はこちら。

https://learn.microsoft.com/ja-jp/azure/foundry-local/get-started

Foundry Local を使用開始する - Foundry Local

Foundry Local を使用して最初の AI モデルをインストール、構成、実行する方法について説明します

learn.microsoft.com

NPU対応モデルを探す

Foundry LocalのWebページで探せます。

https://www.foundrylocal.ai/models?npu

Foundry Local - Run AI Models Locally with Complete Privacy

Run AI models locally on your device. Foundry Local provides on-device inference with complete data privacy, no Azure subscription required.Discover and explore Foundry local models optimized for various hardware devices including NPUs, GPUs, CPUs, FPGAs and other specialized compute platforms.

www.foundrylocal.ai

Execution DeviceでNPUを選択すると、NPUに対応しているモデルが出てきます。
QwenやPhiなどが選べます。

image.png 204.54 KB

NPUモデルを動かす

これもコマンド1個打つだけです。たとえばPhi 4 Miniの場合：

foundry model run phi-4-mini

そうすると自動的に最適なものを勝手に選んでダウンロードしてくれます。
NPUが入っている場合は、NPU用のものを入れてくれると思います。

無事ダウンロードが終わるとインタラクティブモードになるので、あとは普通にチャットするだけです。
image.png 28.31 KB
何かプロンプトを打つとAIモデルが実行されます。実行中、タスクマネージャでNPUの項目を開くとNPUが稼働していることがわかります！
image.png 73.56 KB
今回使用しているNPUは、NPUとしては高性能なほうなのですが、Phi 4 Miniのような小さなモデルでも出力はゆっくりです。以下のような内容でも出力に20秒ぐらいかかります。
image.png 86.55 KB同じ内容をGemini（高速モード）に入れると7-8秒でもっと詳しい回答が返ってくることを考えると、NPU＋ローカルLLMでクラウドAIモデルのような快適さを求めるのは難しいです。
とはいえ、利用料金ゼロで全部ローカルで処理できる利点があるので、活用方法はいろいろありそうに思います。

このブログ一覧は

メンバー投稿記事

です

メンバー登録すると、限定記事の閲覧やメンバー同士の交流、限定イベントへの参加などができます。

CDLEコミュニティサイトβ版

JDLA（一般社団法人日本ディープラーニング協会）が実施する、G検定・E資格の合格者のみが参加できる、10万人を超える日本最大級のAIコミュニティ「CDLE」の紹介サイトです。 CDLEでは、ディープラーニングの社会実装の日本代表として、社会を発展させるエバンジェリストたちが集まり、学び合い・アウトプットする場を提供しています。

詳細を見る

CDLEメンバー

¥55/月(税込)

登録情報を確認の上、事前登録された方へ本登録のご案内メールを送信します。もっとみる閉じる

登録情報を確認の上、事前登録された方へ本登録のご案内メールを送信します。

このプランに入会する

その他のプランもみる

16リアクション

メンバーの方はこちらからログイン

毎回、似た回答になる？－－多様なデータ出力のためのプロンプト対策

生成AIがもたらす効率化とは何か？―仕事が本当に楽になるのか？