Dify×さくらのAI Engineで国内完結の社内FAQ・RAGを作る方法

Dify×さくらのAI Engineで国内完結の社内FAQ・RAGを作る方法

「社内文書をAIに学ばせてFAQボットを作りたい。でも機密データを海外サーバーに送るのは怖い」――そんな担当者の悩みを解決するのが、Dify × さくらのAI Engineの組み合わせです。

DifyはオープンソースのRAG/AIエージェント構築プラットフォーム。さくらインターネットはさくらのVPS上でDify+さくらのAI Engineを構築できるスタートアップスクリプトを提供しており、スタートアップスクリプトで環境構築の手間を大幅に短縮できます(APIトークンの発行や初期設定は必要)。これにより、データを国内サーバーだけで処理する「国内完結RAG」を比較的低コストで実現できます。

この記事の結論

  • 法人・医療・官公庁など機密性の高い組織:さくらVPS+AI Engineでデータを国内完結させるRAGが最適
  • まずDifyの使い勝手を試したい個人・スタートアップ:国内VPS比較記事(Dify向け国内VPS比較)も参照
  • コスト・スペック感:プランや料金は変動するため、必ずさくらのクラウド公式さくらのVPS公式で最新を確認してください

社内文書→Dify(RAG)on さくらVPS+AI Engine→FAQボット(国内完結)のフロー図
社内文書 → Dify(RAG)on さくらVPS+AI Engine → FAQボット(国内完結)の全体フロー

当ページのリンクには広告が含まれています。
目次

なぜ「国内完結RAG」が必要なのか――情報漏洩対策の観点から

クラウド型AIサービス(ChatGPT APIなど)は手軽である一方、プロンプトに含めた社内文書が海外サーバーに送信されます。個人情報保護法・社内情報管理規程・業界規制(医療・金融など)によっては、これがコンプライアンス上の問題となり得ます。

国内完結が特に重要なケース

  • 社員の個人情報・給与情報を含む社内文書を検索させたい
  • 医療・製造・官公庁など、データ所在の管理義務がある業種
  • 社内規程でデータの海外持ち出しが禁止されている組織
  • 万が一の情報漏洩時に「どのサーバーにあったか」を即答できる体制が必要

国内データセンターのVPS上でLLMを動かすことで、文書のベクトルデータもLLMへの問い合わせも全て国内で完結します。処理ログも自社管理下に置けるため、監査対応もしやすくなります。

構成:さくらのVPS + さくらのAI Engine + Dify

さくらインターネットは「Dify+さくらのAI Engine」スタートアップスクリプトを公式に提供しています(2025年公開、詳細・最新状況はさくらのナレッジを参照)。主要コンポーネントの役割は以下のとおりです。

コンポーネント 役割
さくらのVPS Difyアプリ本体のホスト。国内データセンター設置
さくらのAI Engine 国内完結のLLM推論API。OpenAI互換エンドポイントでDifyから呼び出す
Dify(OSS) RAGパイプライン・チャットUI・ワークフロー管理
Dify内ベクトルDB 社内文書をチャンク化・ベクトル化して検索(Weaviate等)

さくらのAI Engineのポイント

さくらのAI Engineは日本国内のGPUクラスタ上で動作するLLM推論サービスです。OpenAI互換APIを提供しているため、DifyのLLMプロバイダー設定でエンドポイントURLとAPIキーを変更するだけで接続できます。なお、日本語FAQの回答品質は使用するLLM(国産のllm-jp系か、gpt-oss・Qwenなどか)に依存するため、用途に合わせてモデルを選ぶとよいでしょう。利用可能なモデル・料金・リージョンの詳細はさくらのAI Engine公式ページで最新情報をご確認ください。

国内VPSの選択肢を幅広く比較したい方は、Dify向け国内VPSおすすめ比較もあわせてご覧ください。

社内FAQ・RAGボットの作り方(概要)

以下は構築の大まかな流れです。各ステップの詳細な手順・コマンドはさくらのナレッジの公式ガイドを参照してください。

Step 1:さくらのVPSを契約してスタートアップスクリプトを実行

さくらのVPSのコントロールパネルから、用意されている「Dify+さくらのAI Engine」スタートアップスクリプトを選択してVPSを起動します。スクリプトがDocker ComposeでDifyの各コンテナを自動起動するため、手動でのDifyインストール作業を大幅に短縮できます(スクリプトの提供状況・手順は公式ページで要確認)。

Step 2:さくらのAI EngineのAPIキーを取得してDifyに設定

さくらのクラウドコントロールパネルでAI Engineのエンドポイント情報とAPIキーを取得します。DifyのWebUI(http://<VPSのIPアドレス>/)にアクセスし、「設定 > モデルプロバイダー」でエンドポイントURLとAPIキーを入力します。OpenAI互換のため、「OpenAI互換」プロバイダーとして登録するのが一般的です。

Step 3:社内文書をDifyの「ナレッジ」にアップロード

DifyのWebUIで「ナレッジ(Knowledge)」を作成し、PDF・Word・テキストなどの社内文書をアップロードします。Difyが自動でテキスト抽出→チャンク分割→ベクトル化を行い、検索可能な状態にインデックスします。

Step 4:チャットボットアプリを作成してナレッジを紐付ける

DifyのWebUIで「アプリを作成 > チャットボット」を選び、作成したナレッジを「コンテキスト」として紐付けます。システムプロンプトに「以下のナレッジのみを根拠に回答し、不明な場合は不明と答えてください」などのルールを設定することで、ハルシネーションを抑えたFAQボットになります。

Step 5:動作確認・社内公開

DifyのWebUIのプレビュー機能で社内文書に関する質問を投げて、期待通りの回答が返るか確認します。問題なければ埋め込みコード(iframeやAPI)を使って社内ポータルやSlackと連携する方法も検討できます。

機密データの取り扱いに関する注意

  • VPSへのアクセスはSSHキー認証を必須にし、不要なポートは閉じてください
  • Difyの管理者アカウントのパスワードは必ず強力なものに変更してください
  • 文書アップロード時は「本番前にテスト文書で動作確認」を徹底してください
  • LLMへ送られるチャンク(テキスト断片)の内容を把握しておきましょう。さくらのAI Engineは国内処理ですが、どの文書のどの部分がコンテキストとして使われるかをDifyのデバッグ画面で確認できます
  • 法的要件(個人情報保護法・業界規制)への最終的な適合は、必ず自社の法務・セキュリティ担当者と確認してください

よくある質問(FAQ)

Q. さくらのAI Engineを使うとデータは本当に国内だけで処理されますか?

さくらのAI Engineは日本国内のデータセンターで動作するLLM推論サービスです。さくらのVPS上のDifyからAI Engineに問い合わせる際も、通信は国内で完結します。ただし、最新のデータ所在・処理ポリシーはさくらのクラウド公式の利用規約・プライバシーポリシーで必ずご確認ください。

Q. Difyのスタートアップスクリプトを使えばDifyのインストール知識は不要ですか?

スクリプトがDocker Compose環境のセットアップを自動化してくれるため、Dify単体をゼロから構築するよりもハードルは下がります。ただし、VPSの基本操作(SSHログイン・ファイアウォール設定など)やDockerの基礎知識があると、トラブル時の対処が格段にスムーズになります。スクリプトの最新の動作・前提条件はさくらのナレッジをご参照ください。

Q. 料金はどのくらいかかりますか?

主なコストはさくらのVPSの月額費用とさくらのAI Engineの推論費用ですが、AI Engineには基盤モデルを使える無償プランがあり、Chat completions 月3,000リクエスト/Embeddings 月10,000リクエスト/音声文字起こし 月50回/音声合成(TTS)月50回 までは無償で利用できます(無償枠を超えた分はレートリミットがかかる仕組みで、自動的に従量課金へ移行することはありません)。小〜中規模の社内FAQ/RAGの検証であれば、この無償枠で十分まかなえるケースも多くあります。ただし無償プランは申込数に上限があり、またRAG用のドキュメント処理(100チャンク単位)は無償枠の対象外で課金される点に注意してください。VPSのプラン・AI Engineの料金体系は変わることがあるため、さくらのVPS公式さくらのAI Engine公式で最新料金をご確認ください。断定的な金額はここでは記載しません。

Q. 社内文書のフォーマット(PDF・Excelなど)はどこまで対応していますか?

Difyは一般的なドキュメント形式(PDF・TXT・Markdown・HTML・DOCXなど)の取り込みに対応しています。Excelなどの表計算ファイルはCSV変換を挟むと精度が上がることがあります。サポートするフォーマットのバージョンによる違いはDify公式ドキュメントをご参照ください。

料金と無料枠――まずは「基盤モデル無償プラン」で検証できる

さくらのAI Engineには基盤モデルを使える無償プランが用意されています。下記の範囲までは無償で利用でき、検証段階のコストを大きく抑えられます。

基盤モデル無償プランで使える範囲

  • Chat completions:月3,000リクエストまで
  • Embeddings(ベクトル化):月10,000リクエストまで
  • 音声文字起こし:月50回まで
  • 音声合成(TTS):月50回まで

無償枠を超えた場合はレートリミットがかかる仕組みで、自動的に従量課金へ移行することはありません。そのため、小〜中規模の社内FAQ/RAGの検証であれば、この無償枠だけで十分まかなえるケースも多くあります。「最初から従量制コストがかかる」と身構える必要はありません。

無償プランを使う前の注意点

  • 無償プランには申込数の上限があります(枠数に達すると受付が止まる場合があります)
  • RAG用のドキュメント処理(100チャンク単位)は無償枠の対象外で、課金対象となります
  • 料金体系・無償枠の条件は変更される可能性があるため、最新情報はさくらのAI Engine公式で必ずご確認ください

まとめ

Dify × さくらのAI Engineは、「国内完結」「OSS活用」「比較的低コスト」の三拍子が揃った社内RAG構築の有力な選択肢です。

この記事のポイントまとめ

  • 社内の機密文書を扱うRAGは、データが国外に出ない国内完結構成がコンプライアンス上のリスクを下げる
  • さくらのVPS+AI Engineのスタートアップスクリプトで、Difyの環境構築の手間を大幅に短縮できる
  • DifyのナレッジにPDF等の社内文書を登録し、LLMにさくらのAI Engineを設定するだけで国内完結FAQボットの土台ができる
  • さくらのAI Engineには基盤モデル無償プラン(Chat completions 月3,000リクエスト等)があり、小〜中規模の検証は無料枠でまかなえることも多い(RAGのドキュメント処理は課金対象)
  • 料金・無料枠・モデル・スクリプトの最新情報は必ず公式ページで確認すること
  • 他の国内VPS選択肢はDify向け国内VPS比較記事も参考に

まずはさくらのVPSの公式ページで最新のプランと、スタートアップスクリプトの提供状況を確認してみてください。

会員登録でお役立ち資料をダウンロードできます

低コストかつスピーディーなシステム構築を実現できる「ノーコード開発ツール」の選び方ガイドをプレゼント中!

目次