상세 컨텐츠

본문 제목

AI 인프라로서의 Data Center와 Data Center의 효율적 전력 공급 방안

정보통신

by ICT찐찐찐 2024. 5. 21. 21:30

본문

금일은 데이터에 대한 가치가 올라가면서 데이터센터의 중요성이 최근 더욱 더 부각되고 있으며, 데이터센터의 안정적인 운영을 위한 AI 기반 Data Center와 Data Center의 효율적인 전력 공급 방안에 대하여 살펴보겠습니다. 
 

 
 

1. 개요 

Data Center는 서버, 네트워크, 스토리지 등 IT 서비스 제공에 필요한 장비들을 안정적이고 효율적으로 운영하기 위해 물리적인 장소를 제공하는 설비로, 안정적 전원 공급과 고도화된 공조 및 보안 시스템을 제공합니다. 초기의 Data Center는 자체 전산실을 구축하고 운영하는데 있어서 비용적으로 어려움이 있는 기업들을 대상으로 Data Center의 공간을 임대해 주는 Co-Location 서비스를 주로 제공하였습니다.

2. AI 인프라로서의 Data Center

초거대 AI용 Data Center는 AI 가속기를 여러 개 포함하는 AI 서버를 수 천 개에서 수 만개까지 구축하여 운영하게 됩니다. 현재 가장 많이 사용하고 있는 NVIDIA GPU를 이용한 Data Center의 구성은 아래 그림으로 예를 들 수 있습니다.

 

가상화를 기반으로 하는 Cloud 환경이 일반화 되면서 Data Center는 AWS, Azure, GCP, Naver 등과 같이 Cloud 서비스를 제공하는 CSP(Cloud Service Provider)의 가장 중요한 서비스 인프라가 활용되다가, 최근에는 초거대 AI가 발전하면서 대량의 학습 Data를 저장하고 초 고성능의 GPU를 기반으로 하는 서버 자원들을 안정적으로 운영하기 위해 활용되고 있습니다.

 

NVIDIA H100을 이용한 Data Center 구성 예, 출처:https://www.nvidia.com/ko-kr

 
 
최근 Open AI사는 일반적인 지능을 갖는 AGI 서비스를 위해 MS와 손잡고 2028년까지 약 1000억 달러를 투자 기존의 DGX H100 기반 보다 성능이 3배 이상 향상된 GDX B200 기준 약 35만대의 AI 서버를 구축, 시간당 5기가 와트 전력을 소모하는 Data Center를 만드는 스타케이트 프로젝트를 진행하고 있습니다. 이 정도 투자비는 현재 최고 수준의 Data Center 구축 비용의 약 100배이며, 네이버가 운영하는 ‘각 세종’이 10만대 일반 서버를 270메가와트 급으로 운영하고 있는 수준에 비하면 엄청난 규모입니다.

3. Data Center 확산에 따른 전력 수급 문제

초거대 AI를 위한 Data Center의 가장 큰 문제점은 전력을 너무 많이 사용한다는 것입니다. 국제에너지기구(IEA)에 따르면, 2026년 전 세계 데이터센터에 들어가는 전력량은 인구 1억2000만명인 일본이 한 해 동안 쓰는 전기량(939TWh)과 같아질 것으로 전망하고 있습니다.

더군다나 대부분의 전력을 생산하는 발전소의 위치는 대규모 냉각에 필요한 물로 바닷물을 사용하기 위해 대부분 해안가에 위치하기 때문에 내륙에 위치한 Data Center까지 전력을 공급하기 위해서는 구축 비용 뿐 아니라 송전 효율이 낮아지는 문제점이 있습니다.

 

데이터센터 전력 소비량, 출처:조선일보('24.4.24, https://www.chosun.com/economy/tech_it/2024/04/24/FQ5OQ4HEUBFYHJ2XQXFGJZUYOQ

 
 

국내의 경우에도 현재 Data Center의 60% 이상이 수도권에 위치해 있고 29년 정도에는 80% 까지 높아질 것으로 예측되고 있어 갈수록 Data Center 운영을 위한 전력 수급의 문제가 가중 될 것으로 예상됩니다.


이러한 문제점 때문에 OpenAI, MS, AWS, 테슬라와 같이 초거대 AI 시장에서 주도권을 놓고 경쟁하고 있는 회사들은 초거대 AI 모델 경쟁 못지 않게 전력 확보에도 큰 관심을 갖고 태양광과 관련된 신 재생 에너지와 소형 원자력 발전 설비인 SMR(Small Modular Reactor) 회사에 투자를 하고 있습니다.


 

국내 데이터센터 지역별 현황, 출처:: IT Daily (‘22. 12. 21, 한국데이터통신엽합회 자료 근거, http://www.itdaily.kr/news/articleView.html?idxno=211450)

 

4. Data Center에 효율적 전력 공급 방안

전기먹는 하마인 초거대 AI용 Data Center가 효율적으로 전기를 공급받기 위해서는 기술적인 방법과 제도적 방안이 같이 고려 되어야 합니다.

 
가. 기술적인 방안

 ① AI 전용 반도체 개발 및 구축

   - 현재 AI용으로 사용되는 GPU 등은 발열이 심하기 때문에 AI 전용 반도체인 NPU와 PIM 기술이 반영된 HBM과 같이 고성능이지만 저전력이고 발열이 적은 반도체를 사용하는 것입니다.

 ② 액침 냉각 기술 적용

  - Data Center 내 냉각 시설 또한 전기를 많이 사용하는 시설인데, 액침냉각 기술은 열전도도가 높은 특수 냉각유에 서버를 직접 담아 냉각함으로써 기존 공랭식 대비 50% 이상 냉각 전력을 절감할 수 있고, 공랭식 보다 소음이 없어 민원이 감소되는 효과도 있습니다.

③ 데이터 센터 해저 설치

   - 차가운 바닷속에 Data Center를 통째로 구축하는 자연 냉각 방식입니다. 데이터 센터 운영을 위한 전력은 조력과 파력 등으로 발전하여 조달하는 방식으로 MS가 북해에 시범적으로 설치하여 운영하고 있습니다.

 ④ 초전도 케이블 시스템

   - 송전 케이블의 저항은 장거리 송전 시 전압을 감소시켜 송전 효율을 떨어뜨리는 원인입니다. 초전도 케이블 시스템은 송전 케이블의 외피에 액체 질소를 흘려 보내 케이블 내 도체를 영하 200도로 유지함으로써 케이블 저항이 거의 없는 초전도 상태로 유지, 낮은 전압으로도 대용량의 전기를 장거리 송전할 수 있습니다.

 ⑤ SMR (Small Modular Reactor)

   - 원자력 잠수함의 원자로를 민간 발전용으로 전용한 소형 원전입니다. 대형 원전의 1/100 정도의 소형으로 원자로를 구축할 수 있고 크기가 작아 공랭식으로 냉각이 가능해 해안가가 아닌 Data Center 인근에 설치 할 수 있는 장점이 있습니다. 또한 원자로가 소형이고 일체형이어서 사고 위험이 낮다는 장점도 있지만, 원전 사고에 대한 주민 반발 등은 해결해야 하는 숙제입니다.

⑥ 신재생 에너지 활용

   - Data Center에서 태양열 발전 등의 시설을 직접 구축함으로써 Data Center 자체 필요 전력을 공급하는 방식입니다.
 
나. 제도적 방안

 ① 전력 계통 영향도 평가 등의 제도 도입

   - 수도권에 Data Center가 밀집되는 현상을 완화 하기 위해서 Data Center 처럼 대용량 전력이 필요한 시설의 경우 전력 계통에 부담이 예상되는 지를 확인해 전기 공급을 거부하거나 개선을 요구할 수 있는 제도로써, 분산에너지 활성화 특별법에 포함되어 시행될 예정입니다. 제도 시행으로 Data Center의 수도권 밀집 현상을 해소할 수 있을 것으로 기대하고 있습니다.

 ② 인센티브를 통한 지방 이전 유도

   - 비 수도권 지역에 Data Center 건립 시 배전망 시설 부담금 50% 경감해 주거나, 송전망 연결 때 예비 전력 요금을 면제하는 인센티브 제공하여 지방 이전을 유도하는 방식입니다.

 ③ 폐열 재활용으로 지역 사회 연대

   - Data Center에서 발생되는 열을 지역 난방 에너지에 활용함으로써 인근 상가나 주택에 난방을 공급하면서 지역 사회의 난방 비용을 절감하는 방안입니다.

 
 

5. 맺음말

Open AI의 ChatGPT를 시작으로 AI 혁명은 향후 5년 이내에 일반적인 지능을 갖는 AGI를 기반으로 하는 휴머노이드 로봇까지 등장을 예고하는 등 매우 빠르게 발전하고 있습니다. AI 발전의 기술적인 바탕으로는 수조개의 파라미터를 기반으로 하는 LLM, 고성능/고효율의 AI 반도체 개발이 필요하며 이러한 장비를 구동 시키고 효율적으로 냉각시킬 수 있는 기술의 발전 또한 필요합니다.


국내에서도 초거대 AI 시장에서 해외 사업자와 경쟁하기 위해서는 초거대 AI에 대한 소프트웨어와 하드웨어적인 기술적인 발전도 필요 하지만 AI의 인프라로서의 Data Center를 효율적으로 구축하고 운영할 수 있는 다양한 기술적, 제도적인 방안 수립과 실행이 필요한 때 입니다.

 
정보통신기술사 김동호

반응형

관련글 더보기