Dify 三昧:【速報】Dify v1.11.0 リリース – ナレッジベースがマルチモーダルに対応

はじめに

こんにちは、ディーネットのよろず請負人、深見です。

Dify の進化が止まりません。v1.11.0 がリリースされ、今回の目玉機能はナレッジベースのマルチモーダル対応です。テキストだけでなく画像も扱えるようになり、LLM アプリケーション開発の可能性がさらに広がりました。

本記事では、v1.11.0 の主要な新機能と改善点を詳しくご紹介します。


Dify v1.11.0: ナレッジベースがマルチモーダルに対応

Dify v1.11.0 の最大の特徴は、マルチモーダルナレッジベースの実装です。従来はテキスト情報のみの扱いでしたが、画像も統合的に処理できるようになり、よりリッチな情報検索と活用が可能になりました。

🧠 マルチモーダルナレッジベースの詳細

何が変わったのか?

自動画像抽出機能

  • Markdown 形式で画像が埋め込まれたドキュメントを投入すると、Dify が自動的に画像を抽出・処理します
  • 対応フォーマット: JPG、PNG、GIF(各ファイル2MB まで)

コンテキストを保持した処理

  • 各画像は関連するテキストチャンクとリンクされ、文脈が失われることなく情報が保持されます

埋め込み動作の進化

マルチモーダル埋め込みモデル使用時:

  • テキストと画像の両方がベクトル化されます
  • 以下のような柔軟な検索が可能に:
    • テキストクエリ → 画像検索
    • 画像クエリ → 画像検索
    • 画像クエリ → テキスト検索

通常のテキストのみモデル使用時:

  • 画像はテキストと一緒に保持され、Vision 対応 LLM 使用時にプロンプトへ表示されます

開発者向け機能強化

  • Knowledge Pipeline の KnowledgeBase ノードに新設定を追加:
    • multimodal-Parent-Child
    • multimodal-General
  • プラグイン開発者が構造化された混合モダリティデータを容易に連携できるようになりました

サポートされるマルチモーダルモデル

  • AWS Bedrock: nova-2-multimodal-embeddings-v1:0
  • Google Vertex AI: multimodalembedding@001
  • Jina: jina-embedding-v4jina-clip-v1jina-clip-v2jina-reranker-m0
  • Tongyi (Qwen): multimodal-embedding-v1

UI 上では、マルチモーダル対応データに「Multimodal」タグが表示され、データの種類を一目で確認できます。


🧩 その他の新機能

Zen モード

集中力を高める新しいインターフェース。余分なボタンが非表示になり、作業に没頭できる環境を提供します。

  • ショートカット: Cmd + K(Mac)/ Ctrl + K(Windows)で切り替え

WorkflowTool の「Open Workflow」ショートカット

WorkflowTool から直接ワークフロー編集画面へジャンプ可能になり、開発効率が向上しました。

Start Node JSON Schema 対応

ワークフローの整合性を保つため、スタートノードで JSON スキーマがサポートされました。

Admin API Keys の CSRF スキップ

管理者 API キー使用時の CSRF 検証がスキップされ、自動化処理がスムーズになりました。

UI/UX の改善

  • ダークモードアイコンの最適化
  • ReactScan の統合
  • 全体的なカラー調整とデザイン改善

⚙️ パフォーマンスとインフラストラクチャの改善

処理効率の向上

  • GraphEngine のポーズ/レジューム処理: ワークフローの一時停止・再開がよりスムーズに
  • Redis キャッシング: ツールプロバイダーリスト表示の高速化

デプロイメントの改善

  • 自動ストレージ権限修復: 起動時に init コンテナがファイルシステム権限を自動修正し、異なるストレージバックエンドでのデプロイが容易に
  • Milvus 2.6.0 へのアップグレード: Docker 環境での安定性が向上

コード品質の向上

  • Pydantic のアップグレード: ノードのハイドレーションコードを整理
  • UI ラグの軽減: ワークフローやマーケットプレイスでの不要な再レンダリングを削減
  • 包括的なテストの見直し: 埋め込み、データセット、プラグイン、ワークフローなど広範なテスト実施

🐞 主要なバグ修正

  • Webhook ノード変換エラーの解決: 既存ノードを Webhook ノードに変換する際の 404 エラーを修正
  • チャット自動スクロールの安定化: 自動スクロールが停止する問題を解決
  • OceanBase ベクトル検索の精度向上: score_threshold パラメータ処理を適正化
  • ダークテーマのレンダリング調整: ツールチップ表示やテキストカラーの不整合を修正
  • MySQL クエリ互換性の修正: UUID クエリと returning ステートメントに関する問題を解決
  • データベースセッション管理の修正: ワークフロー実行中の複数回初期化エラーを解消
  • UI 整合性の向上: 小画面でのテキスト表示やツールチップ動作などの細かな問題を修正

バージョンアップ時の注意点

Docker Compose 利用の場合

  1. 既存の docker-compose.yaml ファイルをバックアップ
  2. 最新のコードを取得
  3. サービスを停止し、データをバックアップ
  4. docker compose up -d でアップグレード実行

トラブルシューティング:
hostname resolving error が発生した場合は、以下のコマンドを使用してください:

docker compose --profile postgresql up -d

詳細は GitHub Issue #28706 を参照。

ソースコードからのデプロイの場合

  1. API サーバー、Worker、Web フロントエンドサーバーを停止
  2. リリースブランチ 1.11.0 から最新のコードを取得
  3. Python 依存関係を更新: uv sync
  4. マイグレーションスクリプトを実行: uv run flask db upgrade
  5. 各サーバーを再起動

おわりに

Dify v1.11.0 は、マルチモーダルナレッジベースの実装により、テキストと画像を統合的に扱える強力なプラットフォームへと進化しました。Vision 対応 LLM との組み合わせで、これまで以上に高度な AI アプリケーション開発が可能になります。

パフォーマンス改善やバグ修正も多数含まれており、安定性も向上しています。ぜひ最新バージョンへのアップデートをご検討ください。


補足情報

注意1: 本記事執筆時点では、Dify 管理コンソールのメニュー通知で v1.11.0 が表示されない場合があります(v1.9.2 や v1.10.1 と表示される可能性があります)。アップデート状況については公式ドキュメントでご確認ください。

注意2: Dify v1.10.1 以前では、React/node.js の脆弱性の問題 (CVE-2025-55182) が存在しています。対応済みのバージョンは v1.10.1-fix.1 もしくは今回の v1.11.0 以降となります。


参考リンク


本記事は Dify v1.11.0 のリリースノートを基に作成されています。最新情報は公式サイトをご確認ください。

返信を残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA