ITプロジェクトの内製化vs外注の判断基準

McKinseyの報告では、大規模ITプロジェクトは平均でコスト超過が約45%、価値実現も「計画より56%低い」水準にとどまるとされています¹。 また、DORA(DevOps Research and Assessment)の研究は、デプロイ頻度が高く変更のリードタイムが短い組織ほど、変更失敗率が低く回復時間も短い傾向を示します²。公開された複数の調査を総合すると、内製化か外注かの議論は、結局「短期のスピード」と「中長期の能力形成」のトレードオフに収斂します。すなわち、一時的にベロシティを外部から調達するのか、継続的に自社の学習曲線を積み上げるのかという問いです。価値創出の核がどこにあるかで答えは変わるため、まず用語を整えます。ここでいう内製化は、要件定義から運用改善までを自社で反復できる状態、外注はその一部または全部を外部に委ねることを指します。そして判断は単一指標ではなく、コスト、速度、品質、リスク、学習という五つの軸の合成として捉えるのが妥当です。CTOの視点では、この五軸に「要件の不確実性」と「プロダクトのライフサイクル段階」を掛け合わせたうえで、意思決定を行うのが現実的な判断基準になります。
判断の土台を揃える:戦略・価値・境界の再定義
最初の落とし穴は、内製化と外注をコスト比較だけで決めてしまうことです。公開研究では、要件の不確実性が高い領域ほど固定価格契約はリスクを内包し、調達コストの見かけの安さが変更コストの増大に飲み込まれやすいと示唆されています⁷。逆に、要件が安定しコモディティ化している領域では、外部の規模の経済が働き、品質や単価で内製を上回る可能性が高まります⁵。この見極めには、プロダクト戦略の文脈が不可欠です。価値源泉が顧客体験やデータネットワーク効果にある場合、変更のリードタイム自体が競争優位の源泉になりやすく、社内のデリバリー能力を核に据える意義が生まれます⁹。
戦略のフレームとして有効なのが、活動を「差別化の中核」と「コンテクスト」に分ける考え方です⁴。中核に該当する領域では、仕様探索と実装、検証、運用改善が高速に反復されます。このサイクルの摩擦が小さいほど学習が加速し、DORAの四指標(デプロイ頻度、変更リードタイム、変更失敗率、平均復旧時間)³が改善します。ここは原則として内製の比重を高めるほうが、長期の累積価値が大きくなりやすい。一方で、コンテクスト領域、たとえば社内共通のITSM、汎用CMS、認証基盤、監視の一部などは、SaaSやマネージドサービス、実績ある外部パートナーの活用が合理的です。標準化と自動化を最大限に活かし、自社固有性を無理に作らないことが合致します。
実例に触れます。B2Cのサブスクリプション企業を想定した一般的なケースでは、初期に外注でモバイルアプリを立ち上げ、獲得単価の低下とLTVの伸長に伴い事業が拡大します。スケール段階に入ると、キャンペーン改修に数週間を要する外部依存のリードタイムがボトルネック化し、ABテストの学習サイクルが停滞しがちです。ここでフロント、計測、リリースの三領域を段階的に内製へ移行すると、デプロイ頻度は週次から日次へ、変更リードタイムは日単位から数時間へ短縮されることが期待できます。結果として試行回数が増え、成長率の勾配が再び立ち上がる可能性が高まります。すべてを内製する必要はなく、ログ基盤やCDN、エラートラッキングはマネージドを継続するなど、核とコンテクストの境界を再設計することが鍵です。
コストとROIを経営に接続する:TCO、オプション価値、稼働リスク
意思決定を経営に接続するには、総保有コスト(TCO)と価値のタイミングを同じ土俵で比較する必要があります。単純な日額や見積比較は、内製の固定費化や外注の変更コスト、ナレッジ蓄積の価値を捉えきれません。ここでは三つの視点を重ねます。第一にTCOです。人件費、雇用税、教育、ツール、インフラ、セキュリティ、品質保証、マネジメントといったコストを期間で積分し、想定稼働率で割り戻して単位アウトプット当たりの原価を推定します。第二にオプション価値です。要件の不確実性が高いほど、短いイテレーションで試行しピボットできる「権利」の価値が上がります。これは金融のリアルオプションの考え方に近く、変更のリードタイムが短い内製組織はその価値を低コストで保有できます。第三に稼働リスクです。外注ではリソースの引き当てやベンダーロックイン、内製では採用難や属人化など、いずれもキャパシティ不足が事業計画のクリティカルパスに影響します⁸。リスクは確率と影響度で金額化し、期待値としてコストモデルに織り込みます。
試算の例を挙げます。あるプロダクトの主要な機能改修が月20ポイント必要で、外注単価が1ポイント10万円とします。見積上は月200万円です。内製チームはエンジニア3名、平均の総コストが一人月120万円、合わせて360万円ですが、学習により3カ月でスループットが月25ポイントに上がり、平均リードタイムが半分になったと仮定します。外注はスループットが一定で変更コストが高止まりしやすいのに対し、内製は学習によりアウトプット単価が逓減する設計です。さらに、DORAの「変更失敗率」が5%から2%に改善すると、障害起因の機会損失や顧客離脱のコストが逓減します。これらを割引現在価値で比較すると、短期では外注が有利、6〜12カ月のホライズンでは内製が逆転する、という結論が矛盾なく導かれます。重要なのは、期間と前提を明示して比較することです。
外部調査とも整合します。DeloitteのGlobal Outsourcing Surveyでは、外注の主目的がコストから価値とイノベーションへシフトしていると示されます⁵。これは、ベンダーが最新の専門性や加速度を提供できる領域では外注の投資対効果が高い一方、顧客接点やデータ駆動の意思決定など事業の核では、社内能力の構築が価値実現のボトルネックになっていることの裏返しです。したがって、同じプロジェクトでも、探索フェーズでは内製のスパイクとベンダー伴走を混在させ、拡張フェーズでは一部機能を外部にスピルオーバーし、安定フェーズでは運用をマネージドへ寄せるなど、時間軸でポートフォリオを動的に最適化する発想が合理的です。
速度・品質・リスクのトレードオフを指標で管理する
意思決定を属人的にしないために、DORAの四指標を計測し、速度・品質・回復力のバランスを可視化します³。変更リードタイム、デプロイ頻度、変更失敗率、平均復旧時間のいずれも、内製と外注で異なる伸びしろが現れます。一般に、外部ベンダーは初期の立ち上がりが速く、既存のテンプレートや自動化資産を活かして短期のスループットを確保しやすい半面、要求の微調整が増えると承認と契約の摩擦でリードタイムが伸びます。内製は立ち上がりに投資が要るものの、ドメイン知識の内在化が進むにつれて変更が安く速くなり、失敗の学習が次の成功確率を高めます。
品質の観点では、欠陥密度やエスケープド・ディフェクト率を、投入工数ではなく価値イベント(注文、アクティベーション、継続利用)単位で追うと、事業への影響が明確になります。たとえば、広告LPの改修は同じバグ1件でも売上感度が高く、プラットフォームの内部APIのバグは顧客影響は小さいが復旧工数は大きい、といった性質差があります。ここで、内製チームが観測しているユーザー行動データと品質データを結合できるかどうかが、根本原因分析の速度を左右します。外部委託でも、テレメトリの標準化やダッシュボードの共有を行えば、これらの差は緩和できます。
リスクは、セキュリティ、コンプライアンス、事業継続の三層で捉えます。セキュリティでは、脆弱性対応のSLA、権限管理、SBOM(ソフトウェア部品表)の提供、第三者監査の有無が外部ベンダー選定の分水嶺になります。内製でも、依存OSSの脆弱性管理や機密データのアクセス分離に投資が必要です。コンプライアンスは業界規制や国際移転に関わるため、データ所在と処理の可視化が鍵です。事業継続の観点では、単一ベンダー依存、属人化、キーパーソン離脱などのシナリオを想定し、交代可能性とドキュメント資産の厚みを指標化します。いずれの場合も、SLO(サービスレベル目標)とエラーバジェットの運用を導入し、プロダクトの可用性目標に照らして変更のペースを調整することで、速度と信頼性のトレードオフを統治可能にできます⁶。
実行の設計図:ハイブリッド運用、ガバナンス、組織学習
最適解は固定的な内製か外注かではなく、両者をプロダクトライフサイクルと機能境界に沿って組み合わせることです。探索段階では、プロトタイプとユーザー検証を内製のクロスファンクショナルチームで素早く回し、技術選定やアーキテクチャの仮説を立てます。同時に、領域専門性を持つベンダーをワークショップ形式で巻き込み、アンチパターンや既知の落とし穴を早期に潰します。拡張段階では、インターフェースで明確に分割できる機能を外部に委ね、コア体験の改善は内製が継続する設計が有効です。ここで注意したいのは、契約形態です。成果物ベースの固定価格に寄せすぎると学習ループが断絶し、チーム境界で仕様が硬直化します。時間・素材ベースでも、成果の定義をDORA指標や事業KPIに結びつけることで、関係性が生産的になります⁷。
ガバナンスは、アーキテクチャとプロセスの両輪が必要です。アーキテクチャは、境界づけられたコンテキスト、API契約、イベント駆動の連携、データのオーナーシップを明示し、独立デプロイ可能性を高めます。これにより、外部委託範囲の変更やベンダー切替の摩擦が下がります。プロセス面では、共通のDefinition of Ready/Done、レビュー基準、セキュリティゲート、パフォーマンステストの合意により、チーム間の品質ばらつきを抑えます。開発環境とCI/CDは、内製・外注問わず同じパイプラインに接続し、観測可能性を共有します。ログ、トレース、メトリクスのダッシュボードを共通化し、障害対応のポストモーテムを合同で実施すると、学習が組織全体に拡散します。
組織学習の観点では、ペアリング、ローテーション、ギルド、テックトーク、設計レビューの公開化など、知の流通速度を高める仕掛けが効きます。外部の専門家を短期的に招聘し、社内の実装を伴走してもらう「シャドーイング」や「コーチング型」委託は、請負中心の関係よりも学習効果が高く、内製化の移行コストを下げます。採用との連動も重要です。内製比率を上げるほど、採用の歩留まりとオンボーディング速度が価値実現に影響します。ここでも指標で管理します。新規入社者が最初の価値提供を行うまでの時間、1人当たりのデプロイ数、レビューループの滞留時間、設計の手戻り率などを継続的に可視化し、ボトルネックを解消します。
最後に、実務の意思決定フローを文章で描写しておきます。まず事業戦略とロードマップから価値仮説を抽出し、顧客接点やデータ活用など中核の活動を特定します。次に、活動ごとに不確実性と差別化の度合いを評価し、コアは内製優先、コンテクストは外部活用優先という初期方針を置きます。続いて、TCOとオプション価値、稼働リスクを数値化し、期間ごとにNPVを比較します。ここで仮説に基づくシナリオを三つほど用意し、ベース、楽観、悲観で感度分析を行います。実行フェーズに入ったら、DORA指標と顧客価値KPIを週次でレビューし、境界面の設計と契約条件をチューニングします。四半期ごとにポートフォリオを見直し、内製・外注の比率、ベンダー構成、プロセスの改善を更新します。意思決定のログを残し、成功と失敗のパターンをナレッジとして蓄積すると、次の判断の品質が上がります。
参考にできる外部調査とさらなる学習
McKinseyの大規模ITプロジェクト研究は、計画からの逸脱と価値実現のギャップを定量化しています¹。DORAのAccelerateレポートは、ソフトウェア提供能力と組織パフォーマンスの関係を指標で示します²³。DeloitteのGlobal Outsourcing Surveyは、外注の動機がコストから価値へシフトしている現実を捉えています⁵。より実務的には、ここまで述べた指標を自組織で計測する仕組みを用意し、意思決定にフィードバックすることが最短の学習ループになります。
まとめ:判断をプロセス化し、学習を資産化する
内製化か外注かはゴールではなく、価値を最短で最大化するための手段です。短期の速度、期待価値の不確実性、品質と信頼性、リスク、そして組織学習を同じ画面で比較できれば、議論は感情やバイアスから離れていきます。読者が今取り組めることとして、現在のプロジェクトを一つ選び、変更リードタイム、デプロイ頻度、変更失敗率、平均復旧時間を計測し、コアとコンテクストの境界を言語化してみてください。そこにTCOとオプション価値、稼働リスクの簡易モデルを重ねれば、次の一手が自然と見えてきます。内製化の比率を上げるにせよ外注を強化するにせよ、判断をプロセス化して記録し、結果をフィードバックしていく営みそのものが、組織の競争力を底上げします。次の四半期レビューでは、今日からの計測結果とともに、意思決定の仮説がどこまで当たっていたかを静かに検証してみませんか。
参考文献
- McKinsey & Company. Delivering large-scale IT projects on time, on budget, and on value. https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/delivering-large-scale-it-projects-on-time-on-budget-and-on-value
- Google Cloud. Accelerate State of DevOps. Elite performers deploy far more frequently. https://cloud.google.com/resources/state-of-devops
- Google Cloud. Accelerate State of DevOps. Change failure rate and time to restore advantages. https://cloud.google.com/resources/state-of-devops
- InfoWorld. Outsource? Geoffrey Moore on core vs context. https://www.infoworld.com/article/2321869/outsource.html
- Deloitte. Global Outsourcing Survey. https://www.deloitte.com/ie/en/services/tax/analysis/global-outsourcing-survey.html
- InfoWorld. How SLOs and error budgets improve app reliability. https://www.infoworld.com/article/2267823/how-slos-and-error-budgets-improve-app-reliability.html
- CIO.com. Outsourcing: the build/buy battle — risks and rewards of outsourcing. https://www.cio.com/article/264424/outsourcing-the-build-buy-battle-risks-and-rewards-of-outsourcing.html
- CIO.com. Outsourcing: vendor lock-in and resourcing considerations. https://www.cio.com/article/264424/outsourcing-the-build-buy-battle-risks-and-rewards-of-outsourcing.html
- North Highland. Deployment at the speed of business. https://www.northhighland.com/insights/white-papers/deployment-at-the-speed-of-business