데이터 센터 연결

Sep 18, 2025|

높은 - 성능 컴퓨팅 시스템의 변환

 

높은 - 성능 컴퓨팅 시스템의 환경은 전례없는 컴퓨팅 기능을 향해 추진함에 따라 극적인 변형을 겪고 있습니다. 성능 예측에 따르면 높은 {- 최종 컴퓨팅 시스템은 Petascale (10^15 Flops)에서 exascale (10^18 Flops) 컴퓨팅 기능으로 전환되는 3 배에 의해 성장할 것으로 예상됩니다.


이 지수 성장 궤적은 무어 법칙의 지속적인 적용에도 불구하고 전통적인 CMOS 기술 스케일링을 통해 해결할 수없는 근본적인 과제를 제시합니다. 최근의 연구는 Exascale 성능을 달성하기 위해서는 약 100,000 개의 계산 노드를 포함하는 시스템이 필요할 수 있으며, 여기서 데이터 센터 연결은 시스템 아키텍처 및 상호 연결 전략에 대한 우리의 접근 방식을 근본적으로 변경하는 중요한 병목 현상이됩니다. 이러한 시스템의 넓은 규모는 이러한 대규모 계산 리소스를 결합시키는 통신 인프라를 설계하고 구현하는 방법에있어 혁신적인 발전을 요구합니다.

계산 성장 투영

Computational Growth Projection

Petascale에서 Exascale 컴퓨팅 기능으로의 예상 성장

 

상호 연결 네트워크의 점점 커지고 있습니다

 

계산 전력이 증가함에 따라 시스템이 통신하는 방식이 중요한 제한 요소가됩니다.

이 스케일링 챌린지의 의미는 단순한 계산 능력을 초과합니다. 시스템 크기 및 성능 요구 사항이 계속 증가함에 따라 상호 연결 네트워크는 에너지 소비와 전반적인 시스템 성능 모두에 중요한 병목 현상으로 빠르게 떠오르고 있습니다.


상호 연결 인프라에 대한 압력은 이제 네트워크 효율성이 다음 - 생성 컴퓨팅 시스템의 타당성을 직접 결정하는 시점까지 강화되었습니다. 이 현실은 높은 - radix 네트워크 스위치에 대한 강력한 관심을 불러 일으켰으며, 이는 주어진 시스템 스케일에 필요한 총 스위치 수와 소스에서 대상으로 이동하는 데이터 패킷에 대한 홉 수를 줄임으로써 데이터 센터 연결에 대한 강력한 장점을 제공합니다.

 

The Growing Challenge of Interconnection Networks

네트워크 토폴로지 진화

Modern High - 성능 컴퓨팅은 지연 시간을 최소화하고 수천 개의 노드에서 대역폭 활용을 극대화하기 위해 정교한 네트워크 토폴로지가 필요합니다.

 

 

높은 - radix 스위치 아키텍처

 

Hierarchical Connections

계층 적 연결

접힌 Clos 네트워크로 예시되어 계층화 된 아키텍처를 통해 예측 가능한 성능 특성으로 구조화 된 확장 성을 제공합니다.

Direct Connection Topologies

직접 연결 토폴로지

중간 스위칭 단계를 줄임으로써 대기 시간을 최소화하는 평평한 나비 또는 하이퍼 렉스 구성과 같은.

Hybrid Approaches

하이브리드 접근

특정 작업량 패턴 및 시스템 요구 사항을 최적화하기 위해 두 전략의 요소를 결합합니다.

 

높은 - radix 스위치의 기본 장점

  • 높은 이분감 대역폭을 유지하면서 네트워크 직경 감소
  • 동등한 시스템 규모에 필요한 총 스위치 수.
  • 소스에서 대상으로 이동하는 데이터 패킷의 홉 수 감소
  • 아키텍처 최적화를 통해 전체 시스템 효율성을 향상 시켰습니다

 

높은 - radix 스위치의 근본적인 매력은 높은 이분감 대역폭을 유지하면서 네트워크 직경을 줄이는 능력에있어 최신 데이터 센터 연결 아키텍처에 점점 더 매력적입니다. 실제 구현에서 이러한 스위치는 여러 경쟁 제약 조건의 균형을 맞춰야합니다. Chip I/O 대역폭 및 전력 예산은 Radix 스케일링의 가장 중요한 제한 요소를 나타냅니다.


- 포트 대역폭에 따라 유지하려고 시도 할 때 도전은 특히 심각해지면서 데이터 센터 연결 시나리오에서의 대기 시간을 줄이기 위해 스위치 radix를 증가시킵니다. 이 챌린지는 주로 칩 말초의 대역폭 제한에서 비롯된데, 여기서 ITRS (International Technology Roadmap) 예측은 향후 10 년 동안 - 핀 대역폭과 총 핀 카운트 모두에서 약간의 성장만을 나타냅니다.

 

사례 연구 : Cray의 YARC 스위치

 

 

Cray의 YARC 스위치는 데이터 센터 연결을위한 현재 전자 스위칭 기술의 기능과 한계를 모두 보여주는 높은 - 성능 단일 - 칩 구현을 나타냅니다.

 

YARC 아키텍처는 64 개의 양방향 포트에서 공유되는 768 개의 핀을 사용하여 2.4TB/s의 집계 대역폭을 달성합니다. 각 포트에는 3 개의 입력 및 3 개의 출력 데이터 신호가 필요하며, 이는 데이터 센터 연결 애플리케이션에서 향상된 - 속도 신호 무결성을위한 차동 신호를 구현할 때 12 핀으로 두 배가됩니다.

YARC switch power distribution breakdown

YARC 스위치 전력 분배 분류

 

 

전력 소비 문제

 

Power Consumption Challenges

전력 소비는 높은 - 성능 컴퓨팅에서 중요한 제약이되었으며, 종종 원시 계산 기능보다 확장 성을 제한합니다.

 

전력 스케일링 챌린지는 I/O 인터페이스를 넘어 확장됩니다. ON - Chip Global Interconnects는 순전히 전자 솔루션이 해결하기 위해 어려움을 겪는 추가 전력 병목 현상을 제시합니다. 와이어 형상은 트랜지스터 치수로 비례 적으로 확장되지 않기 때문에 글로벌 와이어 성능은 각 기술 생성에 따라 계속 저하됩니다.


대기 시간을 최소화하기 위해 YARC와 같은 고급 스위치는 전역 데이터 및 제어 경로에 리피터 - 장비 와이어를 사용하여 필요한 수많은 중간 버퍼 및 배선 리소스가 필요한 - 스위치 대역가 방치사를 지원합니다. 이 아키텍처 복잡성은 전력 소비를 증가시킬뿐만 아니라 타이밍 폐쇄 및 물리적 설계 구현을 복잡하게하여 전력 효율성과 확장 성이 가장 중요한 데이터 센터 연결 인프라에 계단식 문제를 일으 킵니다.

더 높은 - rate serializer/deserializer (serdes) 기술의 채택은 대역폭 밀도를 증가시키는 한 가지 잠재적 경로를 제공하지만,이 접근법은 상당한 거래 - 오프와 함께 제공됩니다. 높은 - 속도 Serdes 회로는 전환 기능에 사용할 수있는 칩 전력 예산의 상당 부분을 소비합니다.

 

YARC 구현에서 높은 - 속도 차동 세르드 회로는 총 칩 전력의 약 50%를 소비하며, 높은 - 대역폭 전기 신호와 관련된 에너지 비용을 냉정하게 상기시켜줍니다. 이 전력 소비 패턴은 기본 제한을 강조합니다. 전기 신호 전달을 더 빠른 속도로 넓히면 비트 당 에너지가 실질적으로 증가하여 미래의 데이터 센터 연결 요구 사항에 대한 순수한 전자 솔루션의 생존력을 위협합니다.

 

주요 전원 병목 현상

높은 - 속도 Serdes 회로50%

- 칩 글로벌 상호 연결 25%

전환 논리15%

다른 구성 요소10%

 

 

 

 

실리콘 광자 : 패러다임 전환

 

modular-1

혁신적인 상호 연결 기술

 

Silicon Photonics는 빛을 사용하여 데이터 전송을 가능하게하여 - 성능 컴퓨팅 시스템에서 전기 신호 전달의 기본 제한을 극복 할 수 있습니다.

새로운 실리콘 광자 기술 기술은 전자 스위치를 제한하는 핀 대역폭 제한에 대한 변형 솔루션을 제공합니다. 도파관 또는 광 섬유의 직접 커플 링을 - 칩 도파관으로 연결함으로써 Photonic Interconnects는 높은 - 속도 전기 핀의 필요성을 완전히 제거합니다.


개별 광학 신호 속도는 전기 핀 속도와 비슷한 상태로 유지되지만, 도파관 당 골재 대역폭은 밀도가 높은 파장 분할 멀티플렉싱 (DWDM) 기술을 통해 극적으로 증가 할 수 있습니다. 최신 DWDM 구현은 단일 도파관 내에서 독립 통신 채널로 최대 64 파장을 지원할 수 있으며, 대규모 처리량 요구 사항이 계속 확대되는 다음 - 생성 데이터 센터 연결에 특히 중요한 전례없는 대역폭 밀도를 제공합니다.

DWDM 기술 장점

64 독립 채널

다중 파장을지지하는 단일 도파관

대역폭 밀도 증가

단위 영역 당 우수한 데이터 처리량

에너지 효율

긴 - 거리 변속기에 대한 더 낮은 전력 소비

물리적 연결 감소

동등한 대역폭에 필요한 케이블이 적습니다

 

에너지 효율 비교

 

Energy Efficiency Comparison

 

광학 상호 연결의 에너지 장점은 특히 데이터 센터 환경에서 두드러지게되며, 여기서 광 링크에 대한 비트 전송 에너지 (BTE)는 전송 거리와 거의 독립적으로 남아 있습니다. 이 거리 - 불변의 특성은 전기 상호 연결과 급격히 대비되는데, 여기서 BTE는 비 - 반복 조건 하에서 거리로 선형으로 선형으로 자라며 리피터가 신호 무결성 및 대기 시간 성능을 유지하기 위해 사용될 때 훨씬 더 심하게 저하됩니다.

 

 

하이브리드 아키텍처

 

거리 최적화 - 종속 거래 - 전자 기술과 광자 기술 사이의 오프

 

두 세계의 최고

 

광학 상호 연결은 긴 - 거리 통신에 대한 강력한 장점을 제공하지만, 다음 - 생성 스위칭 시스템을위한 최적의 솔루션은 순전히 광학이 아니라 신중하게 설계된 하이브리드 접근법입니다.

 

이 하이브리드 전략은 장거리의 광학 전송을 활용하면서 짧은 거리의 전기 전송을 유지하여 각 기술 영역의 강점을 활용합니다.

Hybrid Architectures
 

 

광학 상호 연결 문제
  • 유휴 기간 동안에도 정적 바이어싱 요구 사항
  • 높은 이용률에서만 최적의 효율성
  • 전기 -에서 - 광학 인터페이스에서의 변환 대기 시간
  • 광 성분의 온도 감도
 
전기 상호 연결 장점
  • 짧은 거리의 낮은 비트 운송 에너지
  • 짧은 - 범위 통신에 대한 빠른 전송
  • 신호 도메인 간의 변환 오버 헤드가 없습니다
  • 설계 방법론을 갖춘 성숙한 기술

 

전기 및 광학 효율 사이의 크로스 오버 지점은 기술 노드, 신호 속도 및 특정 구현 세부 사항을 포함한 여러 요인에 따라 다릅니다. 데이터 센터 연결 요구가 기하 급수적으로 계속 확장됨에 따라 효율성 비교가 점점 비판적입니다. 전자 및 광자 기술에 대한 기능 크기가 다양한 속도로 계속 줄어들 면서이 크로스 오버 지점은 발전하여 변화하는 데이터 센터 연결 요구 사항에 적응할 수있는 시스템 설계의 아키텍처 유연성을 유지하는 데 중요합니다.

 

현재의 예측은 전기에서 광학 신호 전달로의 최적 전환점이 광자 통합 기술이 성숙함에 따라 짧은 거리로 계속 이동할 것이라고 제안합니다.

 

 

기술 로드맵

 

향후 스위칭 응용 프로그램을위한 전자와 광자 솔루션의 평가에는 관련 기간 동안 프로젝트 기능을 제공하는 명확한 기술 로드맵이 필요합니다. 전자 기술의 경우 ITRS는 장치 스케일링, 상호 연결 성능 ​​및 전력 소비 추세에 대한 포괄적 인 예측을 제공합니다. 특히 이러한 메트릭이 데이터 센터 연결 요구 사항에 점점 더 중요 해지므로.

 

그러나 광학 통신 필드에는 유사하게 통합 된 로드맵이 없으므로 전자 및 광자 솔루션 간의 의미있는 성능 및 전력 비교를위한 맞춤형 프로젝션 모델의 개발이 필요합니다.

"실리콘 광자를 CMOS 기술과 통합하는 것은 비용을 달성하기위한 중요한 이정표를 나타냅니다 - 효과적이고 높은 - 대역폭 상호 연결을 데이터 센터에서 상호 연결합니다. 최근 시연은 CO - 광학의 광학적 소비를 50% 증가시키면서 전통적인 소비를 감소시킬 수 있음을 보여주었습니다.

- Miller, Dab, "낮은 - 에너지 정보 처리 및 통신을위한 Attojoule Optoelectronics", Journal of Lightwave Technology, 2017

 

이러한 예측은 전자 및 광자 도메인 모두에서 지속적인 혁신의 중요한 중요성을 강조합니다. PATH FORWARD는 개별 구성 요소의 점진적인 개선뿐만 아니라 신흥 기술의 기능을 완전히 활용하기 위해 시스템 아키텍처의 근본적인 재고를 필요로합니다.

대역폭 성장

 

Bandwidth Growth

 

전력 감소 추세

 

Power Reduction Trends

 

 

 

시스템 - 레벨 의미

네트워크 토폴로지

하이브리드 아키텍처는 더 높은 Radix 스위치로 평평한 네트워크 토폴로지를 가능하게하여 평균 홉 수와 경로 길이의 분산을 감소시킵니다.

성능 지표

새로운 평가 지표는 거리 - 종속 에너지 효율, 정적 전력 및 도메인 변환 오버 헤드를 설명해야합니다.

시스템 설계

물리적 레이아웃 전략, 라우팅 알고리즘 및 트래픽 관리 정책은 하이브리드 아키텍처에 대해 다시 상상해야합니다.

하이브리드 전자 - Photonic Switching Architectures로의 전환은 시스템 설계 및 최적화에 중대한 영향을 미칩니다. 네트워크 아키텍트는 이제 대기 시간 및 대역폭과 같은 전통적인 메트릭뿐만 아니라 거리 - 의존적 에너지 효율, 정적 대 동적 전력 소비 및 도메인 변환 오버 헤드를 포함하는 다중 - 치수 최적화 공간을 고려해야합니다.

 

 

실제 배치 혜택

 광학 상호 연결이 활성화 된보다 유연한 물리적 레이아웃

에너지 효율 향상을 통한 냉각 요구 사항 감소

감소 된 전기 핀 수를 통한 단순화 된 PCB 설계

대기 시간에 대한 응용 프로그램 성능 향상 - 민감한 워크로드

 

 

인공 지능에서 과학적 컴퓨팅에 이르기까지 다양한 응용 프로그램에 의해 데이터 센터 연결 요구 사항이 계속 확대됨에 따라 효율적이고 확장 가능한 상호 연결 솔루션의 필요성이 더욱 시급 해집니다.

 

 

통합은 비교에 접근합니다

 

통합 접근법 장점 도전 성숙함
모 놀리 식 통합 도메인 간의 단단한 커플 링
최소한의 기생 효과
가장 높은 잠재적 성능
장치 최적화의 손상
복잡한 제조 과정
낮은 수율

60%

이기종 통합 독립적 인 최적화
더 높은 구성 요소 성능
더 나은 수율
포장 복잡성
도메인 경계 오버 헤드
더 높은 시스템 비용

80%

Co - 포장 광학 성능 및 비용의 균형
기생 효과 감소 제조
열 관리
정렬 문제
복잡성 테스트

70%

 

하이브리드 시스템의 열 관리 요구 사항은 복잡성의 다른 계층을 추가합니다. 광 장치는 종종 강한 온도 의존성을 나타내므로 안정적인 작동을 유지하기 위해 신중한 열 설계가 필요합니다. 이 열 감도는 높은 - 성능 전자 스위칭 회로에서 상당한 열 발생과 균형을 이루어야하며 정교한 열 관리 전략이 필요합니다.

 

 

성능 지표 및 벤치마킹

 

주요 평가 지표

 

숨어 있음

도메인 변환 오버 헤드 및 전파 지연 포함

 

대역폭

집계 및 당 - 포트 처리량 기능

 

에너지 효율

동적 및 정적 전력 소비 지표

 

신뢰할 수 있음

비트 오류율 및 결함 공차 기능

하이브리드 전자 - Photonic Switches의 성능을 평가하려면 이러한 시스템의 고유 한 특성을 포착하는 새로운 메트릭 및 벤치마킹 방법론이 필요합니다. 골재 대역폭 및 포트 - ~ - 포트 대기 시간과 같은 전통적인 메트릭은 여전히 ​​중요하지만 하이브리드 아키텍처의 이질적인 특성을 반영하는 추가 측정 값이 보충되어야합니다.

 

에너지 효율 지표는 예상 트래픽 패턴 및 활용 수준을 기반으로 적절한 가중치를 사용하여 동적 스위칭 에너지와 정전기 전력 소비를 모두 설명해야합니다.

 

워크로드 - 인식 평가

하이브리드 시스템에서 에너지 효율의 거리 - 에너지 효율의 종속 특성은 워크로드 - 인식 성능 평가가 필요합니다. 주로 로컬 커뮤니케이션 패턴을 갖는 응용 분야는 광학 상호 연결의 제한된 이점을 볼 수있는 반면, 빈번한 - 거리 데이터 전송은 상당한 에너지 절약을 달성 할 수 있습니다.

 

신뢰성 및 가용성 지표는 하이브리드 시스템의 맥락에서 재검토가 필요합니다. 광학 성분은 순수한 전자 시스템의 것과는 다른 새로운 실패 모드 및 저하 메커니즘을 도입합니다. 비트 오류율은 일반적으로 최적 조건에서 광학 링크의 경우 낮지 만 환경 요인 및 구성 요소 노화에 더 민감 할 수 있습니다.

 

시스템 설계는 하이브리드 아키텍처의 성능 장점을 유지하면서 적절한 중복성 및 오류 복구 메커니즘을 통합해야합니다.

문의 보내기