- 生成AIシステムにおいて、データセキュリティを確保してユーザーの信頼を維持するためには、適切な権限管理が肝心です。
- 権限管理の実装には、複雑なデータアクセスルール、並行性、スケーラビリティ、異なるデータソースの特有の動作を扱う必要があり、かなりのエンジニアリング労力が求められます。
- Gleanは最小権限の原則を徹底し、ユーザーが許可された最小限のデータにしかアクセスできないようにし、すべてのアプリケーションで最新の権限を維持してデータセキュリティを確保します。
優れたエンタープライズサーチや生成AIソリューションを最大限に活用するためには、従業員がそれを信頼できることが必要です。そのためには、モデルに入力される情報がすべてのドキュメントに対して設定された権限管理ルールに厳格に従っていることが不可欠です。その保証がないと、従業員は機密文書が機密のままであるかどうかを知ることができません。これにより、ユーザーはプラットフォームへの信頼を失い、使い勝手が低下し、潜在的に変革をもたらす新しいテクノロジーの採用が遅れることになります。
適切に構築された権限管理は、生成AIシステムがアプリやユーザーに関係なく明示的に許可されたデータのみをアクセスし利用することを保証します。例えば、GleanのAIアシスタントは完全に権限を意識してパーソナライズされており、ユーザーが明示的にアクセスできる情報のみを取得します。これにより、機密データのセキュリティと守秘性が維持されるだけでなく、AIの出力の関連性とパーソナライズも向上します。
職場で生成AIの構築・統合を検討しているならば、ビジネス環境で利用できる準備が整っていることを確実にするために、強固な権限管理フレームワークを最優先で導入する必要があります。本ブログ記事では、その理由と方法についてもう少し詳しくお話しします。
包括的でありながら繊細なソリューション
生成AIソリューションは、すべてのコンテンツと活動にアクセスできる必要があります。それが、結果が常に関連性があり、最新で、各クエリに対して必要な情報を正確に提供するための唯一の方法です。しかし、権限管理とプライバシーに関しては、敏感な情報を安全に保つために、すべてのレベルで厳格なデータアクセスルールを遵守する必要があるため、課題が生じます。
例えば、Gleanが導入されるとすぐに、権限管理とデータアクセスルールは重要な優先事項となります。Gleanは最小権限の原則に基づいて動作し、ユーザーには認可された最小限のアクセス権のみが付与されます。これにより、Gleanのシステムはすべてのアプリケーションにわたって複数のレベルで存在するデータアクセスルールを厳格に適用することができます。
並行処理とスケーラビリティ
もう一つの大きな課題は、スケールに関係なく、常に最新の状態を保つことです。データセキュリティを確保するためには、権限のリアルタイムでの更新が必要です。権限ルールは頻繁に変更されるため、できるだけ早く反映させることが重要です。しかし、APIの制限などの要因が、すべての種類のドキュメントにおける情報の取得と処理を妨げることがあります。
クローラーの開発と同様に、APIの問題や不安定な要素も権限情報を扱う際に大きな問題を引き起こします。権限管理構造は、これらの複雑さに対応できる柔軟性と耐久性を持ちつつ、各ドキュメントが各ユーザーにどのように表示されるべきかを理解できるだけの堅牢性を備えている必要があります。
さらに、ドキュメントの権限を計算し保存することは、パフォーマンスとストレージ効率の観点からも重要です。ユーザー権限をドキュメントごとに個別にマークアップするのは魅力的ですが、それをインデックス化することは非常にコストがかかりかつストレージの需要が増えるため、ドキュメントの読み込みパフォーマンスに悪影響を及ぼします。
{{richtext-banner-component}}
統一された権限モデル
その代わりに、すべてのデータソースに適応可能なフレームワークを構築することが望ましいです。このフレームワークは、各データソースの異なる権限アーキテクチャを理解することができる必要があります。しかし、データソースの権限はモデルドキュメント権限のようにユーザーのリストのような基本的なものであったり、ネストされたグループ、ユーザーの役割ベース、その他の独自なプロパティのように、複雑な場合もあります。
各データソースの権限フレームワークは一意であり、ドキュメントの可視性をどのように実装しているかを把握するためには調査や逆エンジニアリングが必要です。また、権限管理の挙動はよく文書化されていないことが多く、すべての解決策を網羅するほど包括的ではないため、これがさらに課題となります。
データソースには、検索機能をそのまま再現するために対応する必要がある独自の動作があることもあります。考慮すべきエッジケースの例には次のようなものがあります。
- ユーザーがそのドキュメントを以前に訪れた場合のみ公開されるドキュメント。例えば、特定のGDriveの権限がこれに該当します。
- 一時的なアクセス権限。一部のデータソース権限では、一定の時間のみ権限を付与することがサポートされており、この動作を再現するためにはシステムを常に同期させる必要があります。
- 許可されたユーザーやグループのフラットなリストを提供しないドキュメント。これらのドキュメントは、一般的な「許可された」基準と「許可されていない」基準のみを指定し、手動で解決する必要があります。
上記のすべてを考慮したシステムを開発することは広範な努力を必要とし、相当なエンジニアリングリソースと労力が求められます。Gleanでは、これらの複雑さとエッジケースに対応できるように、あらゆる規模のコーパスに対応するソリューションを調整するのに数年かかりました。
適切な権限管理がAIを企業向けに最適化
適切に構築された権限管理システムをどんな生成AIや検索ソリューションにも導入することは、そのシステムがエンタープライズ向けに準備されていることを保証するために不可欠ですが、実際に構築するのは簡単ではありません。生成AIソリューションのために安全な権限管理を調整するには時間がかかり、その結果として価値の実現が遅れたり、社内調整の難しさや、開発、維持、トレーニングにかかる多大なコストが後々生じる可能性があります。
企業データはどの組織にとっても最も貴重なリソースであり、それを最適に活用・保護する方法を理解することが、複雑なデジタルワーク環境に新しいツールを導入する中でますます重要になってきます。今日からすぐにエンタープライズ向けの生成AIを導入したい方は、包括的な権限管理ソリューションを提供するGleanのデモにお申し込みください!