目次
はじめに
こんにちは、ディーネットのよろず請負人、深見です。
Dify の進化が止まりません。v1.11.0 がリリースされ、今回の目玉機能はナレッジベースのマルチモーダル対応です。テキストだけでなく画像も扱えるようになり、LLM アプリケーション開発の可能性がさらに広がりました。
本記事では、v1.11.0 の主要な新機能と改善点を詳しくご紹介します。
Dify v1.11.0: ナレッジベースがマルチモーダルに対応
Dify v1.11.0 の最大の特徴は、マルチモーダルナレッジベースの実装です。従来はテキスト情報のみの扱いでしたが、画像も統合的に処理できるようになり、よりリッチな情報検索と活用が可能になりました。
🧠 マルチモーダルナレッジベースの詳細
何が変わったのか?
自動画像抽出機能
- Markdown 形式で画像が埋め込まれたドキュメントを投入すると、Dify が自動的に画像を抽出・処理します
- 対応フォーマット: JPG、PNG、GIF(各ファイル2MB まで)
コンテキストを保持した処理
- 各画像は関連するテキストチャンクとリンクされ、文脈が失われることなく情報が保持されます
埋め込み動作の進化
マルチモーダル埋め込みモデル使用時:
- テキストと画像の両方がベクトル化されます
- 以下のような柔軟な検索が可能に:
- テキストクエリ → 画像検索
- 画像クエリ → 画像検索
- 画像クエリ → テキスト検索
通常のテキストのみモデル使用時:
- 画像はテキストと一緒に保持され、Vision 対応 LLM 使用時にプロンプトへ表示されます
開発者向け機能強化
- Knowledge Pipeline の
KnowledgeBaseノードに新設定を追加:multimodal-Parent-Childmultimodal-General
- プラグイン開発者が構造化された混合モダリティデータを容易に連携できるようになりました
サポートされるマルチモーダルモデル
- AWS Bedrock:
nova-2-multimodal-embeddings-v1:0 - Google Vertex AI:
multimodalembedding@001 - Jina:
jina-embedding-v4、jina-clip-v1、jina-clip-v2、jina-reranker-m0 - Tongyi (Qwen):
multimodal-embedding-v1
UI 上では、マルチモーダル対応データに「Multimodal」タグが表示され、データの種類を一目で確認できます。
🧩 その他の新機能
Zen モード
集中力を高める新しいインターフェース。余分なボタンが非表示になり、作業に没頭できる環境を提供します。
- ショートカット:
Cmd + K(Mac)/Ctrl + K(Windows)で切り替え
WorkflowTool の「Open Workflow」ショートカット
WorkflowTool から直接ワークフロー編集画面へジャンプ可能になり、開発効率が向上しました。
Start Node JSON Schema 対応
ワークフローの整合性を保つため、スタートノードで JSON スキーマがサポートされました。
Admin API Keys の CSRF スキップ
管理者 API キー使用時の CSRF 検証がスキップされ、自動化処理がスムーズになりました。
UI/UX の改善
- ダークモードアイコンの最適化
- ReactScan の統合
- 全体的なカラー調整とデザイン改善
⚙️ パフォーマンスとインフラストラクチャの改善
処理効率の向上
- GraphEngine のポーズ/レジューム処理: ワークフローの一時停止・再開がよりスムーズに
- Redis キャッシング: ツールプロバイダーリスト表示の高速化
デプロイメントの改善
- 自動ストレージ権限修復: 起動時に init コンテナがファイルシステム権限を自動修正し、異なるストレージバックエンドでのデプロイが容易に
- Milvus 2.6.0 へのアップグレード: Docker 環境での安定性が向上
コード品質の向上
- Pydantic のアップグレード: ノードのハイドレーションコードを整理
- UI ラグの軽減: ワークフローやマーケットプレイスでの不要な再レンダリングを削減
- 包括的なテストの見直し: 埋め込み、データセット、プラグイン、ワークフローなど広範なテスト実施
🐞 主要なバグ修正
- Webhook ノード変換エラーの解決: 既存ノードを Webhook ノードに変換する際の 404 エラーを修正
- チャット自動スクロールの安定化: 自動スクロールが停止する問題を解決
- OceanBase ベクトル検索の精度向上:
score_thresholdパラメータ処理を適正化 - ダークテーマのレンダリング調整: ツールチップ表示やテキストカラーの不整合を修正
- MySQL クエリ互換性の修正: UUID クエリと
returningステートメントに関する問題を解決 - データベースセッション管理の修正: ワークフロー実行中の複数回初期化エラーを解消
- UI 整合性の向上: 小画面でのテキスト表示やツールチップ動作などの細かな問題を修正
バージョンアップ時の注意点
Docker Compose 利用の場合
- 既存の
docker-compose.yamlファイルをバックアップ - 最新のコードを取得
- サービスを停止し、データをバックアップ
docker compose up -dでアップグレード実行
トラブルシューティング:
hostname resolving error が発生した場合は、以下のコマンドを使用してください:
docker compose --profile postgresql up -d
詳細は GitHub Issue #28706 を参照。
ソースコードからのデプロイの場合
- API サーバー、Worker、Web フロントエンドサーバーを停止
- リリースブランチ
1.11.0から最新のコードを取得 - Python 依存関係を更新:
uv sync - マイグレーションスクリプトを実行:
uv run flask db upgrade - 各サーバーを再起動
おわりに
Dify v1.11.0 は、マルチモーダルナレッジベースの実装により、テキストと画像を統合的に扱える強力なプラットフォームへと進化しました。Vision 対応 LLM との組み合わせで、これまで以上に高度な AI アプリケーション開発が可能になります。
パフォーマンス改善やバグ修正も多数含まれており、安定性も向上しています。ぜひ最新バージョンへのアップデートをご検討ください。
補足情報
注意1: 本記事執筆時点では、Dify 管理コンソールのメニュー通知で v1.11.0 が表示されない場合があります(v1.9.2 や v1.10.1 と表示される可能性があります)。アップデート状況については公式ドキュメントでご確認ください。
注意2: Dify v1.10.1 以前では、React/node.js の脆弱性の問題 (CVE-2025-55182) が存在しています。対応済みのバージョンは v1.10.1-fix.1 もしくは今回の v1.11.0 以降となります。
参考リンク
本記事は Dify v1.11.0 のリリースノートを基に作成されています。最新情報は公式サイトをご確認ください。