基礎 · SEO for Devs

最初の <meta> タグを書き、sitemap を整え、被リンクを 1 本買う前に、まずは「世界観」を確立しておく必要があります。検索エンジンはいったいどう動いているのか? ユーザーが検索するとき、本当に求めているものは何か? Google は何を根拠に「誰を 1 位にするか」を決めているのか? このレイヤーでは具体的な操作は一切教えません。ただ、これらの最も土台となる概念を徹底的に腹落ちさせることだけに専念します。後続のすべて — サイト構築、コンテンツ、リンク、テクニカル最適化 — は、この世界観から導かれる帰結にすぎません。

コードを書ける人であるあなたには、実は天然のアドバンテージがあります。検索エンジンは本質的に巨大な分散システムです — クローラー（Crawler）があり、解析・レンダリングのパイプライン（Pipeline）があり、ストレージ（Index）があり、ランキングアルゴリズム（Ranking）がある。これを「自分が連携しにいく外部システム」として捉えると、多くのことが一気に腑に落ちます。

検索エンジンの仕組み: クロール → インデックス → ランキング

世界一巨大な図書館を想像してください。ただし蔵書目録がまったくありません。そこに、疲れを知らない司書（これが Google のクローラーです）がいて、彼は 3 つの仕事をします。

世界中を走り回り、見つけられるすべての本を片っ端からめくる（クロール / Crawling）。
それぞれの本に要約をつけ、キーワードを登録し、巨大なカード式目録に書き込む（インデックス / Indexing）。
読者が「発酵パンについて書かれた本を探している」とやってきたら、目録の中から最も関連性が高く、最も信頼できる数冊を選び、順番に手渡す（ランキング / Ranking）。

SEO 業界全体は、本質的にこの司書がこの 3 ステップをよりスムーズにこなせるよう手助けすることに尽きます。どれか 1 ステップでも詰まると、あなたのページはユーザーの目に届きません。

クロール（Crawling）: クローラーはどうやってあなたを見つけるか

Google のクローラーは Googlebot と呼ばれます。新しいページを発見する主な経路は 2 つです。

リンクをたどってクロールする: 既知のページを出発点に、ページ内の <a href="..."> リンクを次々とたどって移動していきます。蔓をたどって芋を掘り出すようなものです。これこそが、「内部リンク」と「外部リンク」が SEO でこれほど重要な理由です — どこからもリンクが向いていないページは、道が一本も通っていない孤島と同じです。
sitemap を読む: あなたは自ら sitemap.xml を提出できます。これは蔵書リストを直接司書に手渡すようなもので、「うちにはこれらのページがあるので、ぜひ全部見てください」と伝えるわけです。

さらに、サイトのルートディレクトリに置くプレーンテキストファイル robots.txt を使って、どのエリアには入ってこないでほしいかをクローラーに伝えられます。注意すべきは、これが管理するのは「クロール」であって「インデックス」ではないという点です — ここは初心者が最もよく踏む落とし穴です（インデックスのパートで改めて触れます）。

# https://yourdomain.com/robots.txt
User-agent: *
Disallow: /admin/        # 后台不要抓
Disallow: /cart/         # 购物车这类临时页不要抓
Sitemap: https://yourdomain.com/sitemap.xml

💡 ヒント: Google は各サイトに対しておおまかな「クロールバジェット（Crawl Budget）」を持っています — あなたのサイトをクロールするのにどれだけのリソースを割く気があるか、ということです。小規模サイトなら基本的に気にする必要はありません。しかし数十万ページを抱え、パラメータ付きのゴミ URL が大量にあるような場合は、robots.txt と合理的なサイト構造を積極的に使い、バジェットを本当に重要なページに振り向ける必要があります。

インデックス（Indexing）: クロールされたからといって収録されるとは限らない

クロールは、ページを「ダウンロード」してくるだけです。続いて Google はこのページを**解析（Parse）してレンダリング（Render）**します。HTML を読み、タイトルと本文を抽出し、JavaScript を一通り走らせ、ページがいったい何について書かれているのかを理解する。そこでようやく、これをインデックス（索引データベース）に保存するかどうかを決めるのです。

ここに開発者にとって特に重要な落とし穴があります。JavaScript レンダリングです。あなたのページが純粋なクライアントサイドレンダリング（CSR）のシングルページアプリで、初期 HTML がほぼ空っぽ、本文はすべて JS がブラウザ内で生成する — という作りだったとします。Googlebot は JS を実行できるとはいえ、レンダリングは「二度目の順番待ち、遅延処理」で行われるため、遅いうえに完全である保証もありません。その結果、コンテンツの収録に長い時間がかかったり、そもそも見てもらえなかったりします。これこそが、SEO で**サーバーサイドレンダリング（SSR）または静的生成（SSG）**が強く推奨される理由です — クローラーが最初に手にする HTML の中に、すでに完全なコンテンツが入っている状態を作るのです。

ページが「クロールされたのにインデックスされない」のは非常によくある現象で、その原因はたいてい次のとおりです。

コンテンツが薄すぎる、重複している、あるいは低品質と判定され、Google が収録する価値なしと見なした。
noindex タグでブロックされている（下に例があります）。
canonical で別のページを指していて、Google がそれを単なる複製だと見なした。
レンダリングに失敗し、クローラーには真っ白な画面しか見えなかった。

ランキング（Ranking）: 数百もの信号から順序を選び出す

ユーザーがクエリを入力すると、Google はミリ秒単位でインデックスから候補ページを引き出し、数百ものランキング信号を使ってスコアをつけ、順位を並べ替えます。順位を「決定づける」単一の要因など存在しません — それは総合的に天秤にかけた結果なのです。

ランキングの裏側には、あなたには見えない 2 層の処理もあります。

クエリ理解: Google はあなたのその一言が本当に何を尋ねているのかを分析し、同義語を処理し、誤字を訂正し、あなたが何かを買いたいのか知識を学びたいのかを見分けます（これが次節の「検索意図」です）。
パーソナライゼーション: あなたの地理的な位置、言語、デバイス、さらには検索履歴までもが、結果を微調整します。だからこそ「私の順位」という言い方自体が正確ではないのです — 人によって、場所によって、目にする SERP はまったく違うものになりえます。

🧑‍💻 開発者の視点: あなたのページが本当に収録されているかどうかを知るには、便利なツールが 2 つあります。

Google の検索ボックスに site:yourdomain.com と入力すると、Google がそのドメインのどのページを収録しているかが見え、おおよその件数がつかめます。単一ページを調べたいなら site:yourdomain.com/your-page です。

Google Search Console にログインし、「URL 検査（URL Inspection）」ツールに任意の URL を貼り付けると、そのページのクロール状況、インデックス状況、レンダリング後の HTML、そしてなぜ収録されていないのかを教えてくれます — これは問題を切り分ける第一の現場です。

「クローラーにやさしい」最小限のインデックス可能な HTML は、こんな形をしています — コンテンツが HTML に直接書かれていて、見出しの意味が明確で、本文を JS の後ろに隠していません。

<!DOCTYPE html>
<html lang="zh-CN">
  <head>
    <meta charset="utf-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1" />
    <title>家庭烘焙入门：第一次做酸面包</title>
    <meta name="description" content="零基础也能上手的酸面包教程，含发酵时间表与常见翻车点。" />
    <link rel="canonical" href="https://yourdomain.com/sourdough-101" />
  </head>
  <body>
    <h1>第一次做酸面包，从养酵种开始</h1>
    <p>酸面包不靠商业酵母，全靠你自己养的天然酵种……</p>
  </body>
</html>

⚠️ 注意: あるページをインデックスされないように能動的に阻止したいなら、<meta name="robots" content="noindex"> を使います。ただし前提として、そのページは robots.txt でブロックされていてはいけません — クローラーはまずページをクロールできて初めて、中の noindex 指示を読めるからです。両方を同時に使うと、かえって noindex が効かなくなってしまいます。

検索意図（Search Intent）

検索意図とは、ユーザーがそのキーワード列を打ち込むとき、頭の中で本当に達成したいと思っている目標のことです。これが現代 SEO の核心です。Google がランク付けするのは「キーワードに最もマッチするページ」ではなく、「その意図を最もよく満たすページ」です。コンテンツをどれだけよく書いても、ユーザーが尋ねたかった問いに対する答えがズレていれば、やはり上位には来ません。

意図は通常、4 つに分類されます。

情報型（Informational）: 何かを学びたい、答えを探したい。例: 如何重置路由器、什么是 https、react useEffect 用法。
ナビゲーション型（Navigational）: 特定のサイト/ページに行きたい。例: github 登录、b站、stripe dashboard。
商業調査型（Commercial Investigation）: 購入意欲はあるが、まだ比較・下調べの最中。例: 最好用的笔记软件、iphone 15 vs 16、notion 评测。
取引型（Transactional）: すぐに行動する（買う、ダウンロードする、登録する）つもり。例: buy airpods pro、notion 价格、下载 vscode。

あるキーワードの意図はどう判断するか?

最も信頼できる方法は、勘に頼ることではなく、直接 Google で検索してみて、実際の SERP（検索結果ページ）がどんな見た目をしているかを見ることです。Google はすでに膨大なデータを使い、ユーザーが何を求めているかをあなたの代わりに検証済みであり、結果ページがその答えなのです。

画面いっぱいにブログ記事、チュートリアル、Wikipedia が並んでいる → 情報型。深掘りした記事を書くべきです。
商品カードが一列に並び、ショッピング広告、価格が表示される → 取引型。商品ページ / ランディングページを作るべきです。
「おすすめの X」「X 比較ベスト 10」といったランキング系が出てくる → 商業調査型。比較レビューを作るべきです。
最上部にあるブランドの公式サイト + サイト内リンク → ナビゲーション型。基本的にそのブランド自身しか占められません。

💡 ヒント: あるキーワードの SERP が商品ページばかりなのに、あなたは苦労して長い解説記事を書いた、という場合、まず上位に来ることはありません — あなたが提供したコンテンツの形態と、ユーザーが求めているものがまったくの別物だからです。まず SERP を見て、それからどんなページを作るかを決めましょう。

意図タイプ	典型的なクエリ	作るべきページタイプ
情報型 Informational	`什么是 SEO`、`如何申请 https 证书`	チュートリアル、ガイド、ブログ長文、FAQ
ナビゲーション型 Navigational	`github 登录`、`stripe 文档`	ブランド公式サイト、製品ドキュメントの入口
商業調査型 Commercial	`最好的 CDN 服务`、`vercel vs netlify`	比較レビュー、ランキング、深掘りレビュー
取引型 Transactional	`购买域名`、`notion 团队版价格`	商品ページ、料金ページ、登録/購入ランディングページ

E-E-A-T（経験・専門性・権威性・信頼性）

E-E-A-T は Google の『検索品質評価ガイドライン』に書かれている品質評価のフレームワークで、4 つの文字はそれぞれ次を表します。

Experience（経験）: コンテンツの作り手に一次的な、自身の実体験があるか? 酸味のあるサワードウパンについて書いている人は、結局のところ焼いたことがあるのか? カメラをレビューしている人は、本当にそれを手に取って撮影したことがあるのか? これは Google が後から追加した最初の E で、「あちこちから寄せ集めただけで、自分では一度も使っていない」コンテンツに対抗するために設けられました。
Expertise（専門性）: 作者はその分野で本当に精通しているか? 医学記事は医師の手によるものが望ましく、コードのチュートリアルは実戦経験のあるエンジニアによるものが望ましい。
Authoritativeness（権威性）: あなた（あるいはあなたのサイト、あなたの作者）は、その分野で広く認められた権威ある情報源か? これは大部分が「他人があなたをどう見ているか」に表れます — 例えば、どれだけ多くの高品質なサイトがあなたを引用し、リンクしているか、といった点です。
Trustworthiness（信頼性）: サイト全体が信頼に値するか? 情報は正確か? HTTPS は導入されているか? 明確な連絡先、返金ポリシー、作者の署名はあるか? これは 4 項目のうち Google が最も重要だと考えている項目です。

ここで、はっきりさせておくべきよくある誤解が 2 つあります。

E-E-A-T は直接いじれる「ランキング要因」ではありません。コードに 1 行書いて E-E-A-T を +10 する、などということはできません。これは Google がアルゴリズムを訓練し、「このページのコンテンツ品質はそもそもイケてるのか」を評価するための全体的なフレームワークです。ランキングに影響しますが、それは無数の具体的な信号を通じて間接的に表れます。
テーマによって「厳しさの度合い」が違います。ここで YMYL（Your Money or Your Life） の話が出てきます — 「あなたのお金や命に関わる」テーマで、医療・健康、金融・資産運用、法律、身の安全などが含まれます。この種のコンテンツは、ひとたび誤ると直接ユーザーに害を及ぼすため、Google はそれらに対する E-E-A-T 要求をはるかに高くします。ゲーム攻略でしくじっても誰も怪我をしませんが、薬の用量についての記事を書き間違えれば人の命に関わりかねません — 基準が天と地ほど違うのは当然です。

🧑‍💻 実装チェックリスト（E-E-A-T を目に見える、手で触れるものにする）:

作者情報: 記事ごとに署名し、作者プロフィール、肩書き、関連経歴を添え、できれば実在する作者ページにリンクします。

引用元: 重要なデータや結論には出典を明記し、根拠なく断言するのではなく、権威ある一次資料にリンクします。

HTTPS: サイト全体で HTTPS を強制します。これは「信頼性」の合格ラインであり、ブラウザも Google も見ています。

About ページ / お問い合わせページ: 「私たちは誰か、どう連絡すればよいか」を明確に示します。連絡先すらないサイトに、信頼など語れません。

実際の事例と一次素材: 自分で撮ったスクリーンショット、実測データ、本物の使用写真は、汎用的なフリー素材よりはるかに勝ります。

コンテンツの鮮度: 更新日を明記し、古くなったコンテンツを定期的に見直します（このサイトでは各記事の冒頭に updated フィールドがあり、まさに自ら手本を示しています）。

主要なランキング要因

Google には数百もの信号がありますが、それらは大きく4 つの柱にまとめられます。この 4 本の柱を理解すれば、「どこに力を注ぐべきか」を判断する枠組みが手に入ります。

コンテンツの関連性（Relevance）: あなたのコンテンツは、ユーザーのクエリの意図に本当に答え、そのトピックに本来あるべき深さをカバーしているか。これが土台です — コンテンツがズレていたら、残り 3 つがどれだけ良くても挽回できません。
リンクと権威性（Authority / Backlinks）: どれだけ多くの高品質な外部サイトがあなたにリンクしているか。信頼できるサイトからのリンク 1 本 1 本が、Google に「こいつは信頼に足る」と伝える「1 票」のようなものです。
ユーザー体験（User Experience）: ページの表示は速いか、スマホで使いやすいか、広告がやたら飛び回らないか。そのうち定量化できる一群の指標が Core Web Vitals（コアウェブバイタル）と呼ばれ、読み込み速度、インタラクションの応答性、視覚的な安定性を測ります — この部分は第 2 レイヤー『サイト構築レイヤー』で、どう測り、どう最適化するかを専門に詳しく解説します。
テクニカルな健全性（Technical Health）: サイトがスムーズにクロール・インデックスされるか、HTTPS があるか、モバイル対応しているか、構造化データはあるか、デッドリンクやリダイレクトチェーンが山積みになっていないか。これは前の 3 つを「Google に正しく見てもらえる」ための前提です。

柱	一言での説明
コンテンツの関連性	検索意図に的確に命中し、十分に深いか — すべての土台
リンク / 権威性	高品質な外部リンクは、他サイトがあなたに投じる「信頼の票」
ユーザー体験	速度、モバイルフレンドリー、Core Web Vitals、ユーザーをイライラさせるな（第 2 レイヤーで詳説）
テクニカルな健全性	クロール可能、インデックス可能、HTTPS、デッドリンクなし — 前の 3 つを Google に見てもらうための前提

💡 ヒント: 初心者は最初から「リンク」（外部リンクを買うこと）にこだわりがちです。しかし順序は逆であるべきです: まずテクニカルな健全性とコンテンツをしっかり固めること。さもないと、せっかく引き込んだ評価（権威）を、水漏れする土台の上に注ぐことになり、すべてが無駄になります。

まとめ

このレイヤーの心得は、3 つの文に凝縮できます。

検索エンジンを、自分が連携しにいくシステムとして捉える — クロールされる、インデックスされる、ランク付けされる、は順を追って進む 3 つの関門です。
まず意図を問い、それからページを作る — ユーザーがどんな形態の答えを求めているか、その形態をそのまま提供する。自分本位に語ってはいけません。
品質はオカルトではなく、実装できる信号である — E-E-A-T と 4 つの柱は、どれも今日からあなたが手を動かせる具体的なアクションに分解できます。

✅ このレイヤーを離れる前に、自分が本当に理解できたか問いかけてみましょう。

「クロール → インデックス → ランキング」の 3 ステップがそれぞれ何をしているのか、自分の言葉で説明できる
site: と Search Console を使って、あるページが収録されているかどうかを確認する方法を知っている
なぜ純粋なクライアントサイドレンダリング（CSR）が SEO にやさしくないのかを理解している
4 種類の検索意図を区別でき、「まず実際の SERP を見る」という判断方法を知っている
E-E-A-T が単一の要因ではないことを理解し、YMYL がなぜより厳しく求められるのかも分かっている
主要なランキングの 4 つの柱を挙げられ、どんな順序で力を注ぐべきかを知っている

この世界観が手に入ったら、いよいよ次は手を動かす番です。第 2 レイヤー『サイト構築レイヤー』に進み、これらの原則を、検索エンジンに正しくクロール・インデックスされ、良い成績を出せる実際のサイトへと落とし込んでいきましょう。