Maira 概要
Mairaによって、自分のデータでトレーニングされ、ニーズに応じてカスタマイズされた独自のGPTベースのソリューションを作成できます。このページでは、作成を始めるための基本情報を紹介します。Mairaに関連するエンドポイントは、当社のサンドボックスから見つけることができます。
これより、Mairaの主要な概念と機能について紹介します。
ドキュメントとデータセット
ドキュメントとは、Gigalogyの住所やGigalogyパーソナライゼーションについての情報など、単一の情報のことを指します。ドキュメントは必ずデータセットに属する必要があります。
データセットとは、複数のドキュメントを1つのファイルに収集したものです。例えば、単一のデータセットには、Gigalogyの住所やGigalogyパーソナライゼーションとは何か、Mairaとは何かといった情報からなる複数のドキュメントが含まれていることがあります。
ドキュメントとデータセットは、ユーザーのアプリケーションのためにMairaをトレーニングする際に使用されるユーザーからの情報です。
データセットとドキュメントの管理については、"Mairaデータセット管理"チュートリアルで詳しく説明しています。
プロフィール
プロフィールは、Mairaのユニークで強力な機能です。プロフィール機能によって複数の設定やモードを作成し、ニーズに応じて迅速に切り替えることができます。
エンドポイントPOST /v1/gpt/ask
またはPOST /v1/gpt/ask/vision
を介してMairaに送信される各リクエストには、profile_id
というパラメータが含まれます。このパラメータの値は、情報を保持し、GPTがクエリをどのように処理し、どのように応答するかを指示するGPTプロファイルを指しています。
プロフィールについては、"Maira プロフィール"チュートリアルでさらに詳しく説明しています。
Mairaを始めるためのヒントとなる追加の概念を以下に紹介します。
クエリ、プロンプト、そして会話
- クエリ: クエリとは、アプリケーションのエンドユーザーから送信される"メッセージ"やインプットのことを指します。
- プロンプト: プロンプトとは、"クエリ"を含む、Mairaに応答を生成するために送信される指示の完全なセットを指します。
- 会話: Mairaにおいて、会話は1つのプロンプトとそれに対する応答で構成されています。
会話のタイプ、セッションとコンテキスト
- 会話のタイプ: Mairaにはチャットとクエスチョンという2タイプの会話があります。チャットタイプの会話は、以前の会話を考慮して応答します。一方、クエスチョンタイプは直近のクエリのみを考慮し、以前のやり取りについては認識しません。
- セッション: チャットタイプの会話が文脈を考慮する際には、同じ"セッション"に属する会話を確認します。
- コンテキスト: コンテキストは、Mairaが会話の中で関連性や一貫性のある応答を提供するために使用する情報を指します。Mairaが一貫性を保ち、クエリを深く理解するのに役立ちます。チャットタイプの会話だけでなく、プロフィールに情報を提供することで各プロンプトにもコンテキストを持たせることができます。
会話の要約
Mairaは、ニーズに応じて会話を要約することができます。定義された期間の会話を確認し、すべての会話の完全な要約を生成して、ユーザー希望の形式で表示します。さらに、この要約を編集し、そのデータでMairaをさらにトレーニングするために使用することもできます。
参照ドキュメントと評価
Mairaは主に2つのソースから回答を生成します:
- ユーザー自身がアップロードしたデータから
- LLMの一般知識から
これら2つの知識源のバランスをMairaがどの程度厳密に制御するかを決めることができます。この点を踏まえると、Mairaが回答を生成する際には、すべてのLLMベースのアプリケーションと同様に、その応答にどれだけの確信を持てるのか、またその応答がユーザーから提供されたデータにどの程度基づいているかを把握できることが望ましいです。
この点から、Mairaが応答を生成する際には、回答が抽出された"参照ドキュメント"が表示されます。さらに、Mairaは"評価"スコアも提供し、会話全体がユーザー提供ドキュメントの情報とどの程度一致しているかを示します。この評価スコアと参照ドキュメントの表示により、Mairaの生成する応答への信頼感を高め、より確信を持って活用できるようになります。
今後のチュートリアルでは、Mairaをシステムに統合し、強力なアプリケーションを構築する方法について詳細に深く掘り下げていきます。