2024 | 09 | 27
23.3℃
코스피 2,671.57 75.25(2.9%)
코스닥 779.18 19.88(2.62%)
USD$ 1,328.4 -5.9
EUR€ 1,478.7 -14.0
JPY¥ 918.0 -14.5
CNH¥ 189.5 0.2
BTC 85,934,000 1,515,000(1.79%)
ETH 3,478,000 39,000(1.13%)
XRP 778.7 2.6(-0.33%)
BCH 464,650 6,250(1.36%)
EOS 709.3 5.1(0.72%)
  • 공유

  • 인쇄

  • 텍스트 축소
  • 확대
  • url
    복사

[현장] “엔비디아에만 맡길 수 없다”…인텔 '체질 개선' AI 전략은?

  • 송고 2024.09.26 14:06 | 수정 2024.09.26 14:06
  • EBN 김채린 기자 (zmf007@ebn.co.kr)

인텔, ‘차세대 AI 솔루션 제온6·가우디3’ 신제품 출시

AI··HPC 워크로드 두 배 향상 제온 6 P-코어 신제품

가우디3, 라마2 70B 추론서 H100 대비 최대 20%↑

나승주 인텔 데이터센터 및 인공지능(AI) 사업부 한국 영업 총괄 상무. ⓒEBN 김채린 기자

나승주 인텔 데이터센터 및 인공지능(AI) 사업부 한국 영업 총괄 상무. ⓒEBN 김채린 기자

“‘엔비디아에만 맡길 수 없다’와 ‘특정 경쟁사 대비 좀 더 우수한 성능이 필요하다’는 수요를 기반으로 가우디3에 대한 관심이 높다.”


나승주 인텔 데이터센터 및 인공지능(AI) 사업부 한국 영업 총괄 상무는 26일 서울 여의도 전경련회관에서 열린 제온 6 P-코어(Xeon 6 with Performance-cores)와 가우디 3(Gaudi 3) AI 가속기 출시 기자간담회에 참석해 이같은 자신감을 드러냈다.


AI를 통한 업계 혁신이 지속되는 가운데 보다 가성비(가격 대비 성능)를 따지면서 효율적인 개발과 배포 가능한 인프라 구축을 고심 중인 기업이 증가하고 있다는 점을 염두한 자신감이다. 해당 수요에 대응하기 위해 인텔은 제온 6 P-코어와 가우디 3 AI 가속기를 출시했다.


나승주 상무는 인텔의 전략으로 ‘높은 개방성’을 제시했다. 나 상무는 “우리는 엔비디아 등에 종속되지 않아 특정 밸류에 제한 없는 높은 개방성을 통해 고성능, 가격 측면에서 경쟁력을 보유했다”며 “이는 고객의 시각과 일맥상통한다”고 설명했다.


이어 “현재 기업에게 가장 중요한 것은 AI를 실질적으로 어떻게 서비스할 것인가에 대한 고민”이라며 “이에 보다 더 많은 역량의 하드 인프라가 필요한데, 특정 대체제 외에 (추가적인 방안이) 필요한 상황이다”며 “인텔의 가우디 성능이 예상 대비 실제로 더 좋다 라는 것이 공통적인 피드백이고, 중요한 것은 시간이 지날수록 인텔은 더 뛰어난 성능을 제공할 것”이라고 부연했다.


이날 인텔은 제온 6 P-코어와 가우디 3 AI 가속기를 출시하며, 최적의 와트(watt)당 성능과 더 낮은 총 소유 비용(TCO)을 제공해 강력한 AI 시스템을 지원하겠다고 예고했다. 제온 6 P-코어와 가우디 3 AI 가속기는 데이터센터용 신제품이다.


인텔은 데이터 센터 포트폴리오에 두 가지 주요 업데이트를 포함한 최신 AI 인프라스트럭처 지원사항을 공개했다.


인텔 제온 6 P-코어는 컴퓨팅 집약적인 워크로드를 고효율로 처리할 수 있도록 설계됐다. 이전 세대 대비 2배 높은 성능을 제공한다. 코어 수 증가, 메모리 대역폭 2배 증가, 모든 코어에 내장 AI 가속 기능을 갖췄다. 엣지에서 데이터센터 및 클라우드 환경에 이르기까지 AI의 성능 요구를 충족하도록 설계됐다.


대규모 생성형 AI에 최적화된 가우디 3는 64개의 텐서 프로세서 코어(TPC)와 8개의 행렬 곱셈 엔진(MME)을 통해 심층 신경망 연산을 가속화한다. 가우디 3은 학습 및 추론 작업을 위한 128GB의 HBM2e 메모리와, 확장 가능한 네트워킹을 위한 24개의 200Gb 이더넷 포트를 보유했다.


파이토치(PyTorch) 프레임워크와 허깅페이스(Hugging Face)의 고급 트랜스포머 및 디퓨전 모델과 높은 호환성도 제공한다.


앞서 인텔은 최근 IBM과 협력해 IBM 클라우드에서 가우디 3 AI 가속기를 서비스 방식으로 배포한다고 발표한 바 있다. 인텔과 IBM은 AI를 활용하고 확장하는 데 있어 총 소유 비용을 줄이고 성능을 향상시킬 계획이다.


대규모 AI 배포는 유연한 배포 옵션, 경쟁력 있는 가격 대비 성능, 접근 가능한 AI 기술 등을 고려해야 한다. 인텔의 강력한 x86 인프라와 광범위한 개방형 생태계는 기업들이 최적의 TCO와 성능 대 전력비를 갖춘 고부가가치 AI 시스템을 구축할 수 있도록 지원한다. 특히, GPU 가속 서버의 73%가 호스트 CPU로 인텔 제온을 사용하고 있다.


©(주) EBN 무단전재 및 재배포 금지

전체 댓글 0

로그인 후 댓글을 작성하실 수 있습니다.

시황

코스피

코스닥

환율

KOSPI 2,671.57 75.25(2.9)

코인시세

비트코인

이더리움

리플

비트코인캐시

이오스

시세제공

업비트

09.27 08:23

85,934,000

▲ 1,515,000 (1.79%)

빗썸

09.27 08:23

85,900,000

▲ 1,512,000 (1.79%)

코빗

09.27 08:23

85,995,000

▲ 1,595,000 (1.89%)

등락률 : 24시간 기준 (단위: 원)

서울미디어홀딩스

패밀리미디어 실시간 뉴스

EBN 미래를 보는 경제신문