T

Text Machine

強力なテキストツールを、ブラウザで

Robots.txtジェネレーター

ウェブサイトURL(任意)
ルール

1

User-agent

ディレクティブ

パス

サイトマップURL(1行に1つ)

クロール遅延(秒)

Robots.txtジェネレーター の使い方

  1. 1

    クロールルールを追加する

    「Add Rule」をクリックして User-agent を設定し、Allow か Disallow を選んで、各ルールを適用するパスを入力します。

  2. 2

    任意のディレクティブを設定する

    サイトマップの URL を(1行に1つ)追加し、検索エンジンのクロールを制御するため、任意で crawl-delay を秒単位で設定します。

  3. 3

    ファイルを生成する

    「Generate robots.txt」をクリックして、ルールとディレクティブから正しく整形されたファイルを作成します。

  4. 4

    コピーまたはダウンロードする

    「Copy to Clipboard」または「Download robots.txt」を使い、ファイルをドメインのルート (yoursite.com/robots.txt) にアップロードします。

よくある質問

robots.txt ファイルは何のためにありますか?
robots.txt ファイルは、サイトのどの部分にアクセスしてよいか・いけないかを検索エンジンのクローラーに伝えます。User-agent、Allow、Disallow のディレクティブを使い、ボットがクロール前に読むよう、ドメインのルートに置きます。
Allow ルールと Disallow ルールはどう機能しますか?
Disallow はクローラーを特定のパスからブロックし、Allow は明示的に1つを許可します。これは、ブロックされたディレクトリ内のサブフォルダーを開放するのに便利です。すべてのロボット向けの User-agent ですべてのボットを対象にしたり、Googlebot のような特定のクローラー向けに別々のルールを書いたりできます。
crawl-delay は何をしますか?
crawl-delay は、クローラーがリクエストの間に待つべき秒数を提案し、サーバーの負荷を軽減できます。ただし、すべての検索エンジンがこれを尊重するわけではありません。たとえば Google は crawl-delay を無視し、Search Console のクロール頻度設定を優先します。
サイトマップの行を追加するのはなぜですか?
Sitemap ディレクティブを含めると、クローラーに XML サイトマップを示せるため、ページをより効率的に発見できます。ツールでは複数のサイトマップ URL を1行に1つずつ列挙でき、それらをファイルに書き込みます。
robots.txt はページが Google に表示されないことを保証しますか?
いいえ。Disallow はクロールを防ぎますが、他のページからリンクされていれば、ブロックされた URL もインデックスされることがあります。ページを検索結果から確実に除外するには、robots.txt だけに頼らず、クロール可能なページで noindex メタタグやヘッダーを使ってください。

関連ツール

こちらの便利なツールもどうぞ

メタタグジェネレーター

URLリダイレクトチェーンチェッカー

Open Graph Previewer

HTML エンティティ エンコーダー/デコーダー

HTTPヘッダービューア

サイトマップURL抽出ツール