제16장. Hybrid 전략과 데이터 주권 · 키비타스 아겐티아 3권

*이 장을 다 읽고 나면 알게 될 것: 왜 현실의 기업은 순수 Build도 순수 Buy도 선택하지 않는지, Hybrid 전략의 세 가지 패턴은 무엇인지, 데이터 주권이 왜 AI 시대의 핵심 전략 변수인지, 그리고 한국 기업이 무엇을 안에 두고 무엇을 밖에 둘 것인지를 어떻게 결정해야 하는지*

도입: 서버실 앞에서의 30분

2024년 가을, 나는 한 중견 제조업체의 CTO와 서버실 앞에서 30분을 서 있었다. 서버실이라고 해봐야 사무실 한켠의 작은 방이었다. 랙 네 개. 에어컨 한 대. 먼지가 좀 쌓여 있었다.

CTO가 말했다. "이걸 다 클라우드로 옮기라는 컨설턴트가 있었어요. 올 클라우드. 그런데 우리 생산 데이터를 AWS에 올리는 게 맞는 건지 모르겠어요." 그는 잠시 멈추더니 덧붙였다. "반대로 AI를 전부 여기서 돌리자니, GPU가 없어요."

이 장면이 한국 기업의 현실이다. 순수한 클라우드도 아니고, 순수한 온프레미스도 아니다. 전부 사서 쓰자니 데이터가 불안하고, 전부 만들자니 인력이 없다. 어중간한 곳에 서 있다. 그런데 솔직히 말하면, 어중간한 것이 나쁜 것은 아니다. 현실은 원래 어중간하다. 문제는 어중간하게 *서 있는* 것이지, 어중간한 *자리*가 아니다. 의도적으로 설계된 중간 지대는 전략이다. 무의식적으로 머무는 중간 지대는 혼란이다.

이 장에서는 그 의도적인 중간 지대, 즉 Hybrid 전략을 다룬다. 그리고 그 전략의 밑바닥에 깔린 가장 본질적인 질문을 다룬다. 누가 데이터를 소유하고, 누가 통제하는가. 이것이 데이터 주권이다.

16.1 순수한 것은 교과서에만 있다

15장에서 Build vs Buy의 일곱 가지 결정 변수를 봤다. 그 변수를 다 따져보면 한 가지 결론에 이른다. 대부분의 기업은 양쪽 끝에 서지 않는다. 중간 어딘가에 선다.

이유는 간단하다. 순수 Build는 너무 비싸다. 순수 Buy는 너무 위험하다.

순수 Build를 보자. Foundation Model을 직접 훈련시키고, 인프라를 직접 운영하고, 모든 Agent를 사내에서 개발한다. 이것을 할 수 있는 기업이 세상에 몇 개나 되는가. 구글, 메타, 마이크로소프트. 그 정도다. 한국에서는 네이버와 삼성이 시도하고 있다. 그러나 네이버도 모든 것을 직접 만들지는 않는다. 클라우드 인프라의 일부는 외부에 의존한다. 삼성도 자체 LLM과 외부 LLM을 함께 쓴다.

순수 Buy를 보자. 모든 AI 기능을 SaaS로 가져다 쓴다. Microsoft 365 Copilot, Salesforce Einstein, ServiceNow. 편리하다. 빠르다. 그러나 대가가 있다. 데이터가 밖으로 나간다. 고객 정보, 내부 문서, 영업 전략, 재무 데이터. 이 모든 것이 외부 서버에서 처리된다. 처리 과정에서 모델 학습에 쓰이지 않는다는 약속을 받지만, 그 약속의 무게는 계약서 한 장이다.

그래서 현실의 기업은 Hybrid를 선택한다. 문제는 Hybrid라는 단어가 너무 넓다는 것이다. "우리는 하이브리드로 갑니다"라고 말하면 구체적으로 무엇을 의미하는가. 이것을 세 가지 패턴으로 나눠보자.

잠시 멈추고 생각해보자
당신의 회사는 지금 순수 Build, 순수 Buy, 아니면 어딘가의 중간에 있는가? 그 위치는 의도적 선택인가, 아니면 그냥 그렇게 된 것인가?

16.2 Hybrid 전략의 세 가지 패턴

내가 지난 2년간 여러 기업의 AI 전략을 들여다보면서 반복적으로 본 패턴이 세 가지다.

패턴 1: Core Build + Edge Buy.

핵심 역량은 직접 만들고, 주변부는 사서 쓴다. 이것이 가장 흔한 패턴이다. 예를 들어 금융회사를 보자. 이상거래 탐지 모델, 고객 행동 예측, 실시간 데이터 분석. 이것은 회사의 핵심 경쟁력이다. 이것을 외부에 맡길 수 없다. 직접 만든다. 반면 사내 챗봇, HR 문의 자동응답, 마케팅 이메일 생성 같은 것은 사서 쓴다. 핵심이 아니기 때문이다.

이 패턴의 장점은 명확하다. 핵심 데이터가 안에 남는다. 차별화 요소를 직접 통제한다. 단점도 있다. 핵심과 주변부의 경계를 어디에 그을 것인가가 늘 논쟁이다. 오늘의 주변부가 내일의 핵심이 될 수 있다. 고객 서비스 챗봇을 대수롭지 않게 외부에 맡겼다가, 그 챗봇이 고객 접점의 핵심이 되면 문제가 생긴다.

KB국민은행이 이 패턴에 가깝다. 자체 AI 연구 조직을 두고 핵심 금융 모델은 직접 개발한다. 동시에 클라우드 기반 SaaS도 함께 쓴다. 2025년 기준으로 한국 주요 은행 대부분이 이 방향으로 움직이고 있다.

패턴 2: Platform Buy + Custom Build.

플랫폼은 사서 쓰되, 그 위에 자사만의 기능을 올린다. Azure OpenAI Service를 기반으로 깔고, 그 위에 자사 데이터로 파인튜닝한 모델을 올리고, 자사 업무에 맞는 Agent를 만드는 방식이다.

이 패턴은 속도가 빠르다. 인프라를 직접 구축하지 않아도 된다. GPU를 직접 사지 않아도 된다. 그러나 의존성이 생긴다. 플랫폼 사업자가 가격을 올리면 따라갈 수밖에 없다. 서비스를 중단하면 대안을 급히 찾아야 한다. 2023년에 OpenAI의 가격 정책이 바뀔 때마다 전 세계 스타트업이 흔들렸던 것을 기억하라.

현대자동차가 이 패턴의 사례다. 마이크로소프트 Azure를 기반으로 하면서, 그 위에 자율주행 데이터 분석과 품질 예측 등 자사 고유 기능을 올리고 있다. 독일의 BMW도 비슷하다. AWS 위에 자사의 공장 최적화 AI를 올렸다.

패턴 3: API Mix.

여러 외부 API를 조합해서 쓴다. OpenAI의 GPT를 쓰다가, 특정 태스크에는 앤트로픽의 Claude를 쓰고, 이미지는 Stability AI를 쓰고, 음성은 ElevenLabs를 쓴다. 하나의 플랫폼에 종속되지 않는다.

이 패턴은 유연하다. 가장 좋은 모델을 태스크별로 골라 쓸 수 있다. 한 공급자에 종속되지 않는다. 그러나 복잡하다. 여러 API의 응답 형식을 통합해야 하고, 장애 대응이 분산되고, 비용 관리가 어렵다. 그리고 데이터가 여러 곳으로 흩어진다. 데이터 주권 관점에서 가장 관리하기 어려운 패턴이다.

한국의 스타트업 상당수가 이 패턴을 쓴다. 초기에는 합리적이다. 그러나 규모가 커지면 통합의 비용이 급격히 늘어난다.

세 패턴 중 어떤 것이 정답인가. 정답은 없다. 기업의 규모, 산업, 데이터 민감도, 내부 역량에 따라 다르다. 다만 한 가지는 분명하다. 어떤 패턴을 선택하든, 그 선택의 중심에는 데이터 주권이라는 질문이 있다.

16.3 데이터 주권이란 무엇인가

데이터 주권. 이 단어가 갑자기 중요해진 이유가 있다.

AI 이전의 세계에서 데이터는 그냥 저장되는 것이었다. 서버에 쌓이고, 가끔 분석에 쓰이고, 대부분은 잠자고 있었다. 그래서 데이터를 어디에 두느냐는 비용의 문제였다. 클라우드가 싸면 클라우드에 두고, 온프레미스가 규정상 필요하면 온프레미스에 두었다.

AI가 바꾼 것이 있다. 데이터는 이제 학습의 재료다. AI 모델은 데이터를 먹고 자란다. 당신의 데이터로 훈련된 모델은 당신의 패턴을 안다. 당신의 고객을 안다. 당신의 전략을 안다. 그 모델이 당신의 통제 밖에 있다면, 당신의 지식이 당신의 통제 밖에 있는 것이다.

데이터 주권은 세 가지 질문으로 나뉜다.

누가 소유하는가. 법적으로 이 데이터의 소유권은 누구에게 있는가. 클라우드에 올린 데이터의 소유권은 계약서에 따른다. 대부분의 클라우드 사업자는 고객 데이터의 소유권을 고객에게 있다고 명시한다. 그러나 소유와 통제는 다르다.

누가 통제하는가. 데이터를 누가 접근할 수 있는가. 어떤 조건에서 삭제할 수 있는가. 어떤 형태로 반출할 수 있는가. 미국의 CLOUD Act(클라우드법)에 따르면, 미국 기업이 운영하는 서버에 있는 데이터는 미국 정부가 영장을 통해 접근할 수 있다. 서버가 물리적으로 한국에 있어도 마찬가지다. 이것이 통제의 문제다.

누가 학습에 쓰는가. AI 시대의 새로운 질문이다. 당신이 API를 통해 보낸 데이터가 모델 훈련에 쓰이는가. 대부분의 주요 사업자는 Enterprise 계약에서 학습에 쓰지 않겠다고 약속한다. 그러나 무료 또는 저가 티어에서는 다르다. 그리고 약속은 정책 변경으로 바뀔 수 있다.

이 세 가지 질문에 명확히 답할 수 없다면, 당신은 데이터 주권이 없는 것이다.

잠시 멈추고 생각해보자
당신의 회사가 쓰는 AI 서비스 중에서, 데이터가 어디서 처리되는지 정확히 아는 서비스가 몇 개인가? 모른다면, 왜 모르는가?

16.4 세계는 데이터를 두고 싸운다

데이터 주권은 기업만의 문제가 아니다. 국가의 문제다.

EU의 GDPR. 2018년 시행된 이래 세계에서 가장 강력한 데이터 보호 규정이다. 개인 데이터의 역외 이전을 엄격히 제한한다. 기업이 EU 시민의 데이터를 EU 밖으로 가져가려면 까다로운 조건을 충족해야 한다. 위반 시 전 세계 매출의 4%까지 과징금을 물린다. 메타가 2023년에 12억 유로의 벌금을 맞은 것이 대표 사례다. GDPR은 단순한 프라이버시 규정이 아니다. 데이터를 전략 자산으로 보고, 그것의 이동을 국가가 통제하겠다는 선언이다.

중국의 데이터 안보법. 2021년 시행된 데이터안전법과 개인정보보호법은 GDPR보다 더 나아간다. 중국 내에서 생성된 데이터는 원칙적으로 중국 밖으로 나갈 수 없다. 중요 데이터는 반드시 중국 내 서버에 저장해야 한다. 이것이 왜 테슬라가 중국 공장의 데이터를 중국 내 데이터센터에 별도로 저장하는 이유다. 디디추싱이 미국 상장 직후 중국 정부의 데이터 안보 조사를 받고 앱이 삭제된 사건도 이 맥락이다.

미국의 CLOUD Act. 2018년 제정된 이 법은 미국 기업에 대해, 서버가 어디에 있든 미국 정부가 데이터에 접근할 수 있는 권한을 준다. AWS, Azure, Google Cloud를 쓰는 한국 기업의 데이터는 이론적으로 미국 정부의 접근 범위 안에 있다. 이것을 아는 한국 기업은 많지 않다.

한국은 어디에 있는가. 한국은 세 개의 큰 흐름 사이에 서 있다. 개인정보보호법은 GDPR 수준으로 강화되고 있다. 2023년부터 시행된 마이데이터 정책은 금융 데이터의 이동권을 개인에게 준다. 좋은 방향이다. 그러나 AI 학습을 위한 데이터 활용에 대해서는 아직 명확한 법제가 없다. 데이터를 보호하는 법은 있지만, 데이터를 전략적으로 활용하기 위한 법은 부족하다. 보호와 활용의 균형이 아직 잡히지 않았다.

금융 분야를 보면 더 구체적이다. 금융위원회의 금융데이터 활용 가이드라인은 비식별 처리된 데이터의 활용을 허용한다. 그러나 AI 모델 학습에 금융 데이터를 쓸 때의 구체적 기준은 여전히 모호하다. 그래서 한국의 금융회사들은 보수적으로 움직인다. 할 수 있는 것도 안 하는 경우가 많다. 규제의 불확실성이 혁신을 막는 전형적인 사례다.

16.5 Sovereign AI — 국가와 기업의 AI 주권

데이터 주권의 연장선에 더 큰 개념이 있다. Sovereign AI. AI 주권이다.

NVIDIA의 젠슨 황이 2024년부터 이 단어를 적극적으로 쓰기 시작했다. 그의 논리는 이렇다. 모든 국가는 자국의 언어, 문화, 데이터로 훈련된 AI 모델을 가져야 한다. 미국 기업이 만든 모델에만 의존하면 AI 식민지가 된다. 이것은 반도체 주권, 에너지 주권과 같은 맥락이다.

이 말은 상업적 동기가 있다. NVIDIA는 각국 정부에 GPU를 팔고 싶다. 그래서 Sovereign AI를 강조한다. 그러나 상업적 동기가 있다고 해서 틀린 것은 아니다. 실제로 많은 나라가 이 방향으로 움직이고 있다.

프랑스는 Mistral AI를 국가 전략적으로 지원한다. UAE는 Technology Innovation Institute를 설립하고 Falcon 모델을 만들었다. 일본은 NTT와 소프트뱅크를 중심으로 일본어 특화 LLM을 만들고 있다. 인도는 BharatGPT 프로젝트를 추진 중이다. 이 모든 것이 Sovereign AI의 사례다.

한국도 예외가 아니다. 네이버의 HyperCLOVA X, 삼성의 삼성 가우스가 한국어 중심 모델이다. 정부는 AI 반도체와 데이터센터에 투자하고 있다. 그러나 솔직히 말하면, 한국의 Sovereign AI 전략은 아직 조각난 상태다. 모델은 있지만 생태계가 약하다. 인프라는 투자하지만 소프트웨어 역량이 부족하다.

Sovereign AI는 국가 수준의 이야기처럼 들리지만, 기업에도 직접적인 영향을 미친다. 자국 모델을 쓸 수 있느냐 없느냐에 따라 기업의 Hybrid 전략이 달라진다. 한국어를 잘 이해하는 자국 모델이 있으면, 핵심 업무에 그 모델을 쓰고 범용 업무에 글로벌 모델을 쓰는 패턴이 가능해진다. 자국 모델이 없으면, 글로벌 모델에 전면 의존하게 된다. 선택지가 줄어드는 것이다.

잠시 멈추고 생각해보자
한국어를 가장 잘 이해하는 AI 모델이 한국 회사가 아니라 미국 회사의 것이라면, 그것은 문제인가? 문제라면 누구의 문제인가 — 정부의, 기업의, 아니면 개인의?

16.6 온프레미스 AI의 부활

클라우드 시대가 되면서 온프레미스는 구시대의 유물처럼 여겨졌다. 서버를 직접 사고, 직접 관리하고, 직접 업그레이드한다. 비효율적이라고 했다. 클라우드로 가라고 했다.

그런데 AI 시대가 되면서 온프레미스가 돌아오고 있다. 이유는 두 가지다.

첫째, 데이터 주권. 앞서 말한 대로다. 민감한 데이터를 외부에 보내고 싶지 않은 기업이 많다. 특히 금융, 의료, 국방, 법률 분야에서 그렇다.

둘째, 비용. 이것이 의외다. 클라우드가 더 싸다고 했는데, AI 워크로드에서는 반드시 그렇지 않다. GPU 클라우드의 비용은 빠르게 올랐다. 2024년 기준 NVIDIA H100 한 장을 클라우드에서 쓰는 비용은 시간당 약 3~4달러다. 24시간 365일 쓰면 연간 약 3만 달러가 넘는다. 이 비용이면 GPU를 직접 사는 것이 3~4년 안에 손익분기를 넘는다. 물론 전력, 냉각, 관리 인건비를 더해야 하지만, 대량으로 쓰는 기업에게는 직접 보유가 유리해지는 지점이 있다.

이 흐름을 읽은 기업이 있다. NVIDIA는 DGX 시리즈를 통해 기업용 온프레미스 AI 서버를 적극적으로 밀고 있다. DGX B200은 하나의 박스 안에 8개의 GPU를 넣어 수백억 파라미터 모델을 돌릴 수 있다. 델은 PowerEdge 서버에 NVIDIA GPU를 탑재한 라인업을 확대하고 있다. HPE도 마찬가지다.

한국에서도 움직임이 있다. 삼성SDS는 자체 AI 인프라를 구축하고 있다. LG CNS도 온프레미스 AI 환경을 제공한다. KT는 자사 데이터센터에서 AI 서비스를 돌리고, 한국어 모델을 직접 운영한다. 이것은 클라우드의 퇴보가 아니다. 클라우드와 온프레미스의 역할 분담이 다시 그려지고 있는 것이다.

중소기업에게도 길이 열리고 있다. 오픈소스 LLM의 성능이 급격히 좋아졌다. 메타의 Llama 3, 앤트로픽의 Claude를 API로 쓰는 대신, Qwen3나 Llama 같은 오픈소스 모델을 자사 서버에 올리는 기업이 늘고 있다. 2025년 기준 70억 파라미터급 모델은 소비자용 GPU 한 장으로도 돌릴 수 있다. 3년 전에는 상상할 수 없었던 일이다.

16.7 무엇을 안에 두고, 무엇을 밖에 둘 것인가

지금까지의 논의를 종합하면 한 가지 실용적 질문에 도달한다. 무엇을 안에 두고, 무엇을 밖에 둘 것인가.

이것은 기술 질문이 아니다. 전략 질문이다. 그리고 이 질문에 답하려면 자사의 데이터를 네 개의 층위로 나눠봐야 한다.

1층: 핵심 지식 자산. 특허, 설계도, 핵심 알고리즘, 고객 신용 정보, 진료 기록. 이것은 밖에 나가면 안 된다. 어떤 경우에도 외부 API로 보내지 않는다. 온프레미스에서 처리한다. 오픈소스 모델을 쓰든, 자체 모델을 만들든, 이 데이터는 안에서만 움직인다.

2층: 업무 운영 데이터. 생산 데이터, 물류 데이터, 내부 커뮤니케이션, ERP 데이터. 민감하지만 1층만큼은 아니다. 이것은 신뢰할 수 있는 클라우드에서 처리할 수 있다. 다만 데이터가 학습에 쓰이지 않는 Enterprise 계약이 필수다. 그리고 데이터 잔류 지역을 계약으로 지정해야 한다.

3층: 분석과 인사이트 데이터. 시장 분석, 경쟁사 정보, 트렌드 리포트. 이것은 외부 AI 서비스를 적극적으로 쓸 수 있는 영역이다. 민감도가 낮고, 외부 모델의 범용 지식이 오히려 유용하다.

4층: 공개 데이터. 홈페이지 콘텐츠, 마케팅 자료, 공시 정보. 이것은 어디서든 처리할 수 있다. 이미 공개된 것이므로 주권 이슈가 거의 없다.

이 네 층위를 명확히 구분하면, Hybrid 전략이 구체적으로 그려진다. 1층은 Core Build. 2층은 Platform Buy + Custom Build. 3층과 4층은 API Mix 또는 순수 Buy. 데이터의 민감도에 따라 전략 패턴이 결정되는 것이다.

나는 나의 시스템 — 반도체·AI 글로벌 밸류체인 분석·정보 제공 플랫폼 — 를 운영하면서 이 구분을 직접 경험했다. 나의 시스템는 작은 조직이다. 모든 것을 직접 만들 자원이 없다. 그래서 Hybrid를 선택했다. 핵심인 GraphRAG 파이프라인과 고객 데이터 분석은 자체 서버에서 돌린다. ArangoDB와 pgvector로 구축한 지식 그래프, LangGraph로 만든 Agent 오케스트레이션. 이것들은 안에 있다. 반면 범용 텍스트 생성, 번역, 요약 같은 기능은 외부 API를 쓴다. Qwen3를 RunPod 위에서 돌리기도 하고, 필요에 따라 Claude API를 쓰기도 한다.

이렇게 하면 비용을 통제하면서도 핵심 데이터를 지킬 수 있다. 완벽하지는 않다. 솔직히 말하면 매달 어디까지 안에 두고 어디까지 밖에 둘지를 다시 따진다. 기술이 바뀌고, 비용이 바뀌고, 고객의 요구가 바뀌기 때문이다. Hybrid 전략은 한번 정하면 끝나는 것이 아니다. 계속 조정하는 것이다.

잠시 멈추고 생각해보자
당신의 회사 데이터를 네 개의 층위로 나눈다면, 1층에 해당하는 것은 무엇인가? 그것이 지금 어디에 저장되어 있고, 어디에서 처리되고 있는가?

16.8 전략이 아니라 체질이다

이 장에서 다룬 것을 한마디로 줄이면 이렇다. Hybrid는 전략이기 전에 체질이다.

체질이라는 말은 이런 뜻이다. 한번 결정하고 실행하면 끝나는 것이 아니라, 조직 전체가 그 방식으로 사고하고 움직여야 한다는 것이다.

개발팀은 어떤 모듈을 내부에서 만들고 어떤 모듈을 외부에서 가져올지를 매 프로젝트마다 판단해야 한다. 법무팀은 API 계약서에서 데이터 잔류 조항과 학습 제한 조항을 검토해야 한다. 경영진은 데이터의 층위를 이해하고, 각 층위에 맞는 투자 결정을 내려야 한다.

이것이 안 되는 조직이 많다. "우리는 AI를 도입했다"고 말하면서, 정작 데이터가 어디로 가는지는 아무도 모르는 조직. "클라우드로 전환했다"고 말하면서, 핵심 데이터와 범용 데이터의 구분 없이 모든 것을 올린 조직. "보안이 중요하다"고 말하면서, 직원들이 개인 ChatGPT 계정에 사내 문서를 붙여 넣고 있는 조직.

Hybrid 체질은 세 가지를 요구한다.

첫째, 데이터 분류 역량. 우리 데이터 중 무엇이 핵심이고 무엇이 아닌지를 판단할 수 있어야 한다.

둘째, 기술 이해. 온프레미스, 클라우드, API의 차이를 경영진이 이해해야 한다. 기술 용어를 다 알 필요는 없지만, 각 선택의 대가가 무엇인지는 알아야 한다.

셋째, 유연성. 어제의 결정이 오늘은 틀릴 수 있음을 인정하고, 빠르게 조정할 수 있어야 한다. AI의 기술과 비용은 분기 단위로 바뀐다. 1년 전의 전략이 지금은 비합리적일 수 있다.

데이터 주권은 거창한 단어다. 그러나 풀어보면 결국 이렇다. 내 것을 내가 가지고 있겠다는 의지. 그리고 그 의지를 기술적으로 실행할 수 있는 능력. 이 두 가지가 만나는 곳에 Hybrid 전략이 있다.

핵심 정리

현실의 기업은 순수 Build도 순수 Buy도 선택하지 않는다. 대부분은 Hybrid를 선택한다. Hybrid 전략은 세 가지 패턴으로 나뉜다. Core Build + Edge Buy, Platform Buy + Custom Build, API Mix. 각 패턴은 고유한 장단점을 가진다.

이 선택의 중심에 데이터 주권이 있다. 데이터 주권은 세 가지 질문이다. 누가 소유하는가, 누가 통제하는가, 누가 학습에 쓰는가. AI 시대에 데이터는 단순한 저장물이 아니라 학습의 재료이므로, 주권의 무게가 달라졌다.

세계는 데이터를 두고 싸운다. EU의 GDPR, 중국의 데이터 안보법, 미국의 CLOUD Act. 한국은 이 세 흐름 사이에서 보호와 활용의 균형을 아직 잡지 못했다. Sovereign AI라는 개념은 국가 수준의 AI 주권을 의미하며, 기업의 Hybrid 전략에 직접 영향을 미친다.

온프레미스 AI가 부활하고 있다. 데이터 주권과 비용이라는 두 가지 이유 때문이다. NVIDIA DGX, 델 PowerEdge 같은 하드웨어와 오픈소스 LLM의 발전이 이를 가능하게 만들었다.

기업은 자사 데이터를 네 개 층위로 나누고, 각 층위에 맞는 전략을 적용해야 한다. 핵심 지식 자산은 안에, 공개 데이터는 밖에, 그 사이는 신뢰할 수 있는 파트너와 함께. Hybrid는 한번 정하면 끝나는 전략이 아니라, 계속 조정하는 체질이다.

반드시 답해봐야 할 질문 5가지

질문 1. 당신의 회사에서 가장 민감한 데이터 세 가지는 무엇인가? 그것이 지금 어디에 저장되어 있는가? 그 저장 위치는 의도적 선택인가, 아니면 그냥 그렇게 된 것인가?

질문 2. 당신의 회사가 쓰는 AI 서비스의 이용 약관에서, 데이터 학습 관련 조항을 확인해본 적이 있는가? 없다면, 오늘 한번 읽어보라. 무엇이 쓰여 있는가?

질문 3. 세 가지 Hybrid 패턴 중 당신의 회사에 가장 적합한 것은 무엇인가? 그 선택의 가장 큰 이유는 비용인가, 보안인가, 인력인가?

질문 4. 미국 CLOUD Act에 따르면 미국 기업의 클라우드에 있는 데이터에 미국 정부가 접근할 수 있다. 이 사실이 당신의 회사 클라우드 전략에 영향을 미치는가? 미치지 않는다면, 그 이유는 무엇인가?

질문 5. 만약 내일 당신의 회사가 쓰는 주요 AI API가 가격을 두 배로 올리거나 서비스를 중단한다면, 대안이 있는가? 없다면, 그것은 어느 수준의 위험인가?

더 깊이 탐구하기

EU GDPR 공식 가이드 (gdpr.eu). 데이터 보호의 세계 표준이 무엇인지를 이해하기 위한 일차 자료.

NVIDIA, "Sovereign AI" 백서 (2024). 국가 수준의 AI 주권이 왜 필요한지에 대한 NVIDIA의 논리. 상업적 동기를 감안하고 읽되, 프레임워크 자체는 유용하다.

한국 개인정보보호위원회, 「AI 시대 개인정보 보호 가이드라인」 (2025). 한국의 현행 규제가 AI에 어떻게 적용되는지를 정리한 공식 문서.

앤드류 응(Andrew Ng), "AI Transformation Playbook." 기업이 AI를 도입할 때의 단계별 전략을 다룬 실용 가이드. Hybrid 전략의 출발점으로 참고할 만하다.

가트너, "Magic Quadrant for Cloud AI Developer Services" (2025). 주요 클라우드 AI 플랫폼의 비교 평가. Platform Buy 패턴을 선택할 때 참고 자료.

다음 장에서는 Hybrid 전략을 실행했을 때 모든 기업이 부딪히는 현실적 장벽을 다룬다. ROI. 투자 대비 수익을 증명하지 못하면 어떤 전략도 살아남지 못한다. Pilot purgatory라는 함정에서 어떻게 빠져나올 것인가를 본다.