Article

多言語サイトリニューアルの課題と解決策:グローバル対応のポイント

高田晃太郎
多言語サイトリニューアルの課題と解決策:グローバル対応のポイント

英語話者はインターネット全体の約25%に過ぎないという推計もあり1、英語中心の情報設計だけではリーチが頭打ちになりやすい現実が見えてきます。検索動向でも英語以外の言語による利用が拡大しているという分析があり2、ECでは通貨・税・配送オプションのローカライズ有無で離脱率が大きく変わるという報告も出ています3,4。複数の公開調査や事例を横断してみると、グローバル対応のリニューアルは「翻訳を増やす」だけでは成果が出ず、URL戦略、言語・地域の切り分け、国際SEO、実装、翻訳ワークフロー、そして品質保証を一気通貫で設計したチームほど、CVRや自然検索流入の伸長が安定しやすい傾向があります。ビジネスインパクトの源泉は、単なる言語選択UIではなく、BCP47に基づくロケール設計(言語タグの国際規格)、hreflangとカノニカル(正規URL)の整合、言語交渉の副作用管理、メッセージフォーマットの選定、TMS連携の自動化、そして計測可能なQAです5,6,7,8

多言語リニューアルの設計で外せない初期判断

最初のつまずきは、言語と地域を混同することから始まります。ロケールは一般に ja、en-US、fr-CA のように BCP47で表現され5、同じ言語でも通貨や日付、計量法、法的表記の差が成果に直結します。例えば日本市場向け英語サイトを en-US で提供すると、通貨表記、週の開始曜日、利数や桁区切りの違いが支払い段階の不信を招きます。つまり要件定義の段で、ターゲット市場ごとに言語コードと地域サブタグを確定し、UIコピーだけでなくフォーマットやロジックまでローカライズする前提を合意することが肝要です7

URL戦略は検索と運用コストの両面から意思決定します。サブディレクトリは example.com/ja/ のようにドメイン評価を集約しやすく、配信・監視の運用も単純です。サブドメインは region.example.com での分離が効く一方、評価の分散に注意が必要です。ccTLD は市場信頼が最も高い代わりに、ドメイン単位の運用・法務コストが増えます。検索トラフィックの多くをドメイン単位で獲得したいなら ccTLD、プロダクトの成長段階でスピードを優先するならサブディレクトリという意思決定が現実的です12,7

SEOの観点では、hreflang とカノニカルの整合性が生命線です。重複と誤判定を避けるため、各ロケールページは相互に参照し、デフォルト言語を x-default で明示します6,7。さらに自動リダイレクトによるクローラ阻害を避けるため、Accept-Language ベースのサイレントリダイレクトは避け、初回のみランディングを尊重しつつ非侵襲の言語提案に留める設計が望ましいです6。CDNやキャッシュ層では Vary: Accept-Languageの入れ忘れが混在キャッシュを招くため、早期に配信経路へ組み込みます8

<!-- head 内の hreflang と canonical 例 -->
<link rel="canonical" href="https://example.com/" />
<link rel="alternate" href="https://example.com/" hreflang="x-default" />
<link rel="alternate" href="https://example.com/en/" hreflang="en" />
<link rel="alternate" href="https://example.com/en-us/" hreflang="en-US" />
<link rel="alternate" href="https://example.com/ja/" hreflang="ja" />
<meta http-equiv="content-language" content="ja" />
<html lang="ja" dir="ltr">

双方向言語や合字など文字処理の要件も初期段階で洗い出します。アラビア語やヘブライ語では dir=“rtl” の適用、左右反転アイコン、テキスト選択時のカーソル挙動まで確認が必要です9。CLDR/Unicodeのデータに依存するフォーマットは、ランタイムでのロケールデータ読み込みがパフォーマンスの足を引っ張る場合があるため、ビルド時分割やエッジでの前処理を視野に入れます10。詳細な実装方針の背景は内部記事の多言語情報設計ガイドにも整理しています。

実装パターンと言語交渉:SSR/SSG/Edgeの使い分け

実装では、レンダリング戦略の選択がユーザー体験とSEO、そして運用コストを左右します。更新頻度が高く、ロケール条件で価格や在庫が変わるECはSSR(サーバーサイドレンダリング)かISR(インクリメンタル静的再生成)での動的判定が現実的です。一方でナレッジ記事群はSSG(静的サイト生成)が有利です。キャッシュのキーにロケールを含めることで、TTFBを抑えながら整合性を保てます。一般的にも、エッジでのロケール判定とSSGを組み合わせると、キャッシュの効きが良くなりTTFBやLCPの改善が期待できます11

// next.config.js での i18n 設定(Next.js 14)
/** @type {import('next').NextConfig} */
const nextConfig = {
  i18n: {
    locales: ['en', 'en-US', 'ja'],
    defaultLocale: 'en',
    localeDetection: false // 自動検出はミドルウェアで制御
  }
};
module.exports = nextConfig;
// middleware.ts での言語交渉とクッキー固定
import { NextRequest, NextResponse } from 'next/server';
import Negotiator from 'negotiator';

const SUPPORTED = ['en', 'en-US', 'ja'] as const;

type Locale = typeof SUPPORTED[number];

function negotiate(req: NextRequest): Locale {
  try {
    const negotiator = new Negotiator({ headers: Object.fromEntries(req.headers) });
    const lang = negotiator.language(SUPPORTED as unknown as string[]);
    if (!lang) return 'en';
    return (SUPPORTED as readonly string[]).includes(lang) ? (lang as Locale) : 'en';
  } catch (e) {
    // フォールバックを確実に
    return 'en';
  }
}

export function middleware(req: NextRequest) {
  const { pathname } = req.nextUrl;
  // 既にロケールが付いていたら何もしない
  if (/^\/(en|en-US|ja)(\/|$)/.test(pathname)) return NextResponse.next();

  // ユーザー選択の尊重
  const sticky = req.cookies.get('LOCALE')?.value as Locale | undefined;
  const locale = sticky ?? negotiate(req);

  const url = req.nextUrl.clone();
  url.pathname = `/${locale}${pathname}`;
  const res = NextResponse.rewrite(url);
  res.headers.set('Vary', 'Accept-Language');
  return res;
}

サーバー側のミドルウェアで言語交渉を行う場合も、選択の固定とロボット配慮の両立が大切です。ユーザー操作に基づくロケールはクッキーで粘着化し、クローラには静的URLを返し、かつ hreflang で相互参照するのが安全策です6,12。配信層ではVaryヘッダとキャッシュキーにロケールを含め、混入を防ぎます8

# NGINX / CDN 的なキャッシュ層での注意
add_header Vary "Accept-Language" always;
map $http_accept_language $locale {
  default en;
  ~ja ja;
}
# キャッシュキー例: $scheme$proxy_host$uri?lang=$locale

Node/Expressでの実装は、フォーマッタとメッセージカタログの読み込みを非同期化し、例外時のフォールバックを明確にします。サーバークラッシュではなく、英語デフォルトで安全に降りる設計が実運用では役に立ちます。

// Express での i18n 基盤(ICU + @formatjs)
import express from 'express';
import fs from 'node:fs/promises';
import path from 'node:path';
import { createIntl, createIntlCache } from '@formatjs/intl';

const app = express();
const cache = createIntlCache();
const SUPPORTED = ['en', 'ja'] as const;

async function loadMessages(locale: string) {
  const file = path.join(process.cwd(), 'messages', `${locale}.json`);
  try {
    const raw = await fs.readFile(file, 'utf8');
    return JSON.parse(raw);
  } catch {
    if (locale !== 'en') return loadMessages('en');
    return {};
  }
}

app.get('/:locale(en|ja)/product/:id', async (req, res) => {
  const locale = SUPPORTED.includes(req.params.locale as any) ? req.params.locale : 'en';
  const messages = await loadMessages(locale);
  const intl = createIntl({ locale, messages }, cache);
  const price = 1200.5;
  const body = `<html lang="${locale}"><body>${
    intl.formatNumber(price, { style: 'currency', currency: locale === 'ja' ? 'JPY' : 'USD' })
  }</body></html>`;
  res.setHeader('Vary', 'Accept-Language');
  res.send(body);
});

app.listen(3000);

実装の深掘りの詳細があります。

翻訳資産とTMS連携:更新を止めない運用設計

リニューアル後に成果が頭打ちになる理由の多くは運用設計にあります。マーケ施策や法的表記が頻繁に更新される前提で、TMS(翻訳管理システム)をCI/CDに接続し、原文の変更検知から機械翻訳の下訳、ヒューマンレビュー、QA、配信までを直列化するほど、落ち漏れが減り、ページの鮮度を保てます。鍵はメッセージカタログの一貫性とバージョニング、そして文脈情報の提供です。gettext 風の原文キーはライティングの自由度を縛りやすいため、ドメイン別の意味キー設計に寄せ、ICU MessageFormatで数量や性、時制の変化を吸収します13

// React + react-intl での ICU メッセージと複数形
import React from 'react';
import { IntlProvider, FormattedMessage } from 'react-intl';

const messages = {
  'cart.items': '{count, plural, =0 {カートは空です} one {# 点の商品} other {# 点の商品}}',
  'greeting': '{gender, select, male {ようこそ} female {ようこそ} other {ようこそ}} {name}さん'
};

export function Cart({ count, name, gender }: { count: number; name: string; gender: string }) {
  return (
    <IntlProvider locale="ja" messages={messages}>
      <div>
        <p><FormattedMessage id="cart.items" values={{ count }} /></p>
        <p><FormattedMessage id="greeting" values={{ name, gender }} /></p>
      </div>
    </IntlProvider>
  );
}

データベース設計は翻訳対象を構造化するほどスケールします。静的コピーとCMS記事、商品属性、法的文言は更新粒度が異なるため、ストレージを分離し、キーで結合します。以下はRDBでの最小構成例です。

-- ローカライズ可能な文言テーブル
CREATE TABLE i18n_message (
  id BIGSERIAL PRIMARY KEY,
  namespace TEXT NOT NULL,
  key TEXT NOT NULL,
  created_at TIMESTAMP NOT NULL DEFAULT now(),
  UNIQUE(namespace, key)
);

CREATE TABLE i18n_translation (
  id BIGSERIAL PRIMARY KEY,
  message_id BIGINT NOT NULL REFERENCES i18n_message(id) ON DELETE CASCADE,
  locale TEXT NOT NULL,
  text TEXT NOT NULL,
  version INT NOT NULL DEFAULT 1,
  updated_at TIMESTAMP NOT NULL DEFAULT now(),
  UNIQUE(message_id, locale, version)
);

TMSとの連携はWebhookで原文更新を契機にジョブを生成し、翻訳が確定次第、CDNにパージを掛けます。疑似ローカライズをCIに組み込むと、文字膨張やダイアクリティカルマークでの崩れを早期発見できます14

// 疑似ローカライズ(簡易版)
import fs from 'node:fs/promises';

function pseudo(text: string) {
  const map: Record<string, string> = { a: 'à', e: 'ë', i: 'ï', o: 'ô', u: 'ü', A: 'Â', E: 'Ê' };
  return `[!! ${text.replace(/[aeiouAE]/g, c => map[c] || c)} !!]`;
}

async function run() {
  const src = JSON.parse(await fs.readFile('messages/en.json', 'utf8')) as Record<string, string>;
  const out: Record<string, string> = {};
  for (const [k, v] of Object.entries(src)) out[k] = pseudo(v);
  await fs.writeFile('messages/zz.json', JSON.stringify(out, null, 2));
}

run().catch(err => { console.error(err); process.exit(1); });

GraphQLやRESTのスキーマでもロケールは第一級の引数として扱います。バックエンドがロケールを理解していないと、フロント側での結合が増え、バンドルサイズと遅延の両方が肥大化します。

# GraphQL スキーマ例
interface Localized {
  locale: String!
}

type Article implements Localized {
  id: ID!
  locale: String!
  title: String!
  body: String!
}

type Query {
  article(id: ID!, locale: String!): Article
}

品質保証と計測:ロケール単位での可視化と改善

品質は自動化しない限り維持できません。E2Eテストはロケールごとに、言語切り替え、URLの整合、タイトルと hreflang、lang 属性、価格や日付フォーマット、RTLのUI反転を網羅します。バンドルのロケール別コード分割も監視対象に含め、意図せず全ロケールのデータを同梱していないかを継続的にチェックします。Core Web Vitals は市場やネットワーク環境で分散が大きいため、RUMとラボの両輪で、LCP 2.5s 未満、CLS 0.1 未満、INP 200ms 未満を目標に据えます15。ロケール別のLCPを追うと、フォント配信や画像CDNの欠落が可視化されやすく、改善優先度が立ちます。リニューアル後の初期フェーズは、ターゲット主要ロケールで自然検索クリックやCVRの伸び、問い合わせリード品質(商談化率など)の改善を定点観測し、四半期ごとに見直すのが現実的です。仮説検証を加速するために、言語選択UIのABテスト、ロケール別のメタ要素最適化、画像代替テキストの改善を順に打ち、寄与を切り分けます16

パフォーマンス最適化の実務ポイント

ロケールデータの遅延読み込みは、ファーストビューに不要な言語リソースを持ち込まない最有力策です。Intl.Segmenter や相当するポリフィル、通貨・カレンダーデータはロケール別チャンクに分割し、初回は最低限のフォーマッタだけを含めます。画像はロケールごとにテキスト埋め込みの有無が異なるため、派生アセットをビルド時に生成しておくと、HTMLの言語属性との一致で自動選択が可能になります。CDNはジオベースとロケールベースのキャッシュキーを併用し、誤配を避けながらヒット率を維持します。これらの対策はミドルエンド端末の実地計測でもLCP改善に寄与するケースが多く、画像代替テキストのローカリゼーションはセマンティクス改善を通じて国際SEOにも好影響を与えます16

まとめ:グローバルで勝つためのリニューアル指針

多言語サイトのリニューアルは、翻訳の量ではなく、一貫した設計と運用の質で決まります。ロケールの定義からURL戦略、hreflangとカノニカルの整合、言語交渉とキャッシュ、ICUを軸にしたメッセージ設計、TMSを織り込んだCI/CD、そしてロケール別の計測と自動テストを通して、ボトルネックが見える化されます。どれか一つを後回しにすると、翻訳が増えるほど技術負債が雪だるま式に膨らみます。まずは対象市場を三つまでに絞り、ロケールごとのCore Web Vitals、自然検索のクリック、CVRの三指標を毎週レビューする小さな体制から始めてみませんか。小さく始めて早く回すほど、発見と学習のサイクルは短くなります。あなたのチームが次に検証するテーマとして、言語選択UIの出し方、hreflangの網羅率、ロケール別バンドルサイズの三点から着手すると、初月から改善の手触りを得られるはずです。

参考文献

  1. Franceschini, R. et al. Is It True That More Than Half of Web Contents Are in English? Not If Multilingualism Is Paid Due Attention. ResearchGate (2023). https://www.researchgate.net/publication/385672952_Is_It_True_That_More_Than_Half_of_Web_Contents_Are_in_English_Not_If_Multilingualism_Is_Paid_Due_Attention
  2. Search Engine Land. The web is multilingual, but few languages dominate. https://searchengineland.com/web-multilingual-search-few-languages-460026
  3. Ecommerce Age (RWS調査). Four in five consumers won’t buy from a brand that doesn’t offer local language support. https://ecommerceage.co.uk/ecommerce-age/four-in-five-consumers-wont-buy-from-a-brand-that-doesnt-offer-local-language-support/
  4. Reverie. How Localization Can Reduce Bounce Rate and Drive Conversions. https://reverieinc.com/blog/ecommerce-website-bounce-rate/
  5. W3C Internationalization. Language tags in HTML and XML. https://www.w3.org/International/articles/language-tags/
  6. Google Developers. Localized versions (多言語・多地域サイトの実装). https://developers.google.com/search/docs/specialty/international/localized-versions?hl=ja
  7. SISTRIX. The hreflang Guide. https://www.sistrix.com/hreflang-guide/
  8. MDN Web Docs. Vary. https://developer.mozilla.org/en-US/docs/Web/HTTP/Headers/Vary
  9. W3C. Authoring HTML & CSS for right-to-left scripts. https://www.w3.org/TR/i18n-html-tech-bidi/
  10. Unicode CLDR Project. https://cldr.unicode.org/
  11. Cloudflare Learning Center. What is Time to First Byte (TTFB)? https://www.cloudflare.com/learning/performance/what-is-time-to-first-byte-ttfb/
  12. Google Developers. Manage multi-regional and multilingual sites. https://developers.google.com/search/docs/advanced/crawling/managing-multi-regional-sites
  13. Unicode ICU User Guide. MessageFormat. https://unicode-org.github.io/icu/userguide/format_parse/messages/
  14. Microsoft Docs. Pseudo-localization for testing. https://learn.microsoft.com/en-us/globalization/testing/pseudolocalization
  15. web.dev. Core Web Vitals. https://web.dev/vitals/
  16. Google Search Central. Image best practices. https://developers.google.com/search/docs/appearance/google-images/optimize