学習セットのURL登録について

GaiXerの学習セットへのURL登録方法は、「学習データ登録」と「検索サイト指定」の2つの方法があります。

①学習データ登録

  • 指定したURLのページに記載されているテキスト情報のみが学習対象となります
  • ページ内のリンク先は自動的に参照されません
  • リンク先の情報を学習対象に含める場合は、該当URLを別途登録する必要があります

②検索サイト指定

  • 特定のウェブサイト(ドメイン)内の情報をもとに回答を生成します
  • 末尾に「/」がつくURLのみ登録できます
    ※末尾に「/」がついていないURLは、「/」を追記して登録することはできますが、生成の精度が安定しない可能性があります
  • 指定したドメイン内から適切な情報が得られない場合、他のサイトは参照されず、「分かりません」と回答されます

【URLの登録について】
検索サイトでURLを指定する際、指定したURLによって検索対象となる範囲が変わります。
そのため、検索の目的に応じてURLを選択することが重要です。以下のURLを用いて詳細を説明
します。

  • サイト全体の情報から回答を求める場合:ルートドメイン(サイトA)を登録します。
    この場合、サイトA、B、C、Dすべての情報が含まれます。
  • サイト内の特定のカテゴリーのみの情報から回答を求める場合:該当カテゴリーのトップURL
    (例:サイトC)を登録します。
    この場合、サイトCとサイトDの情報が検索対象となりますが、サイトAやサイトBの情報は含まれ
    ません。

この方法により、検索範囲を効果的に制御し、必要な情報のみを対象とした検索結果を得ることができます。

いずれの方法についても、リンクされた外部サイトの情報を参照するには、学習セットにその該当URLを登録する必要があります。また、LLMは幅広い知識を持っているため、指定したページの内容以外からもその知識に基づいて回答を生成する場合があります。

「学習データ登録」は、特定のページの内容に焦点を当てたい場合に適している一方、「検索サイト
指定」は、ウェブサイト全体の広範囲な内容を対象としたい場合に適しています。目的に合わせて登録方法を選択してください。

TOP