지능형 서버
시스템반도체가 탑재된 지능형 서버
지능형 서버 기술은 시스템반도체
FPGA/ASIC 반도체 설계 기술을 기반으로 세계 최초의 AI-HPC(High Performance Computing) 서버 제품화 함.
* 현재, AI, 빅데이터 등의 처리가 필요한 산업영역을 타겟 산업군을 설정, IOT, 바이오, 통신, 국방, 바이오, 전력 등의 시장을 적극 공략.
* CPU는 연산처리 기능과 주변기기 활용을 중심으로 개발이 되었다면 GPU는 그래픽 연산처리에 중점을 두었음.
* 인공지능 빅데이터 시대에 핵심인 데이터 IOPS 처리에 장점을 가지는 있는 반도체 칩을 개발하여 동일한CPU를 사용하면서 최대 수십 배 이상 빠른 AI-HPC를(인공지능 고성능 컴퓨팅) 개발 완료 함.
지능형 서버 기술력
AI-HPC (지능형 고성능 컴퓨팅) 기술을 접목한 AI-HPC 서버 및 지능형 Hybrid 스토리지 시스템 등 융합제품을 개발.
AI-HPC는 글로벌 제품대비 300~1200 % 성능이 우수하며 지능형 Hybrid Storage 제품은 글로벌 All Flash Storage 제품보다 200~300 % 성능이 우수함.
특히 지능형 패턴 분석 S/W는 글로벌 특허를 받은 기술로 데이터의 특징에 따라 저장장치의 특징을 살려 사용하는 인공지능 S/W를 내장하고 있음.
우수 제품 인증 (TPC 인증)
지능형 스토리지
시스템반도체가 탑재된 지능형 스토리지 (Hybrid System)
시스템 반도체란
메모리반도체를 제외한 연산, 제어, 추론 등의 정보처리 역할을 수행하는 반도체
4차 산업은 데이터의 혁명
스마트폰 등 휴대용 개인 미디어의 등장으로 금융, 쇼핑, 길 찾기, SNS 등 우리의 일상생활이 데이터로 기록될 뿐 아니라 전자제품은 물론 생산기계와 가로등, 자동차 등 사물에 부착된 IoT기기에서 생성되는 데이터의 양은 실로 폭발적이라 할 수 있다. 특히, 초고속, 초저지연, 초연결을 지향하는 5G 환경에서는 사물인터넷(IoT)을 통한 데이터 전송과 클라우드 기반의 빅데이터 분석을 통해 언제 어디서나 맞춤형 서비스가 제공 가능하고, 이러한 데이터 기반 환경은 스마트팩토리 등 산업 영역은 물론 재난, 응급, 안전, 보안 등 공공서비스 영역으로 확산되고 있다.
미국, 독일, 일본 등 주요국의 4차 산업혁명 전략도 데이터 활용의 관점에서 자국의 강점을 극대화하기 위한 데이터 경쟁력 강화전략으로 해석이 가능하다. 독일의 예를 들면, 폭발적으로 성장하는 구글 등 인터넷 기반기업에 대항하기 위한 생존전략 차원에서 자국의 강점인 제조업에 인터넷을 결합한 ‘인더스트리 4.0’ 전략을 선택, 독일 정부가 제시한 ‘스마트 서비스 세상(Smart Service Welt)’은 생산 과정에서 양산되는 데이터와 소비자의 구매이력과 행동데이터, 위치 정보 등을 활용하여 소비자 맞춤형 제품과 서비스 제공하고 있다.
데이터 처리를 위한 인공지능 생태계
인공지능 생태계는 크게 지능형 반도체에서부터, 클라우드, 개발 도구, 네트워크, 에지 디바이스, 지능형 서비스에 이르기까지 다양한 공급자와 혁신 상품 및 서비스로 구성되어 있다. 따라서 데이터 처리를 위한 인공지능 서비스가 최종적으로 소비자나 기업에게 전달되기까지는 이러한 복잡한 가치사슬을 구성하는 다양한 활동들이 유기적으로 연계되어야 한다.
인공지능 생태계에서 우리나라가 경쟁력을 보유하고 있는 가치사슬 영역은 하드웨어 부문인 반도체나 종단 장치(사물, 에지 디바이스) 부문이다. 이미 종단 장치 영역에서도 중국이나 신흥 제조국가들이 역량을 축적하며 시장에 진입하였다. 그러나 아직까지 이들 국가들과 일정한 격차를 유지하면서도 선도적인 지위를 지속적으로 가져갈 수 있는 영역은 반도체 부문이며, 특히 인공지능을 지원할 수 있는 지능형 반도체 부문이 중요해 지고 있다.
반도체의 정의 및 분류
시스템반도체는 반도체의 한 종류이다. 반도체 산업은 용도에 따라 메모리반도체와 시스템반도체로 구분되는데 메모리반도체는 데이터를 저장하는 역할을 하며 DRAM, SRAM, VRAM, ROM, Flash Memory 등이 있다. 반면, 시스템반도체는 연산·제어 등의 정보처리 기능을 하는 반도체를 말한다. 사람으로 치면 메모리반도체는 기억을 잘하는 사람이고, 시스템반도체는 정보가 빠르고 계산을 잘하는 사람이라고 할 수 있다. 시스템반도체는 ‘비메모리반도체’ 또는 ‘시스템LSI’ 라고도 부른다.
우리가 늘 쓰는 스마트폰에도 시스템반도체가 내장되어 있다. 애플의 아이폰5S 같은 경우 제품 하나당 반도체가 21개 들어가 있는데 이 중 18개가 시스템반도체, 3개가 메모리반도체다. 이 중 정보처리 및 연산을 담당해 스마트폰의 두뇌 역할을 하는 모바일 애플리케이션 프로세서(AP)가 대표적인 시스템반도체 제품이다. 어떤 스마트폰에 듀얼코어(Dualcore) 프로세서가 탑재됐다고 하면 그 스마트폰은 머리가 2개 있다는 의미이며, 쿼드코어(Quadcore) 프로세서가 탑재되었다면 머리가 4개 있는 셈이다. 듀얼코어 프로세서보다 훨씬 정보를 빨리 처리할 수 있다. 이런 이유로 모바일AP를 스마트폰 성능을 좌우하는 중요한 반도체라고 부른다.
세계 반도체 시장 비중은 메모리 반도체가 20%, 비메모리(시스템) 반도체가 80% 이다. 이중 2018년 4분기 실적기준 우리나라의 세계시장 메모리반도체 점유율은 58%(세계 1위 삼정전자, 3위 SK하이닉스)였다. 시스템반도체(비메모리반도체) 세계시장은 Intel, Qualcomm 등 미국기업이 70%의 시장을 차지하고 있으며, 한국기업의 시장 점유율은 2.8% 수준이다. 즉, PC 및 스마트폰 등 그간 지능형 반도체 시장을 주도해온 Intel, Qualcomm, Broadcom 등이 시장을 지배하고 있는 구조이다. 한국 반도체산업의 경우 그간 메모리 반도체 중심의 성장구조에 따라 지능형 반도체 시장점유율은 삼성전자 2.2%, SK 하이닉스 0.6% 수준에 불과하다.
시스템반도체의 발전
시스템반도체는 전기전자시스템의 신호·정보·에너지 프로세싱(연산/제어/전송/변환 등) 기능을 단일 칩에 통합한 통합 SoC(Convergence System on a Chip)로 발전함으로써 경제성, 편의성, 생산성을 극대화하는 ‘다기능 융복합 반도체’로 진화하고 있다.
최근의 인공지능 서버 발전은 GPU 컴퓨팅의 발전에 힘입은 바가 크나, 비록 CPU보다는 효율적인지만 GPU도 많은 발열과 전력소모로 인해 에너지 효율성 개선 필요성이 제기되고 있다. 인공지능은 아직 에너지 효율성 관점에서 볼 때, 지금보다 500억배 이상 향상되어야 인간을 넘어서는 것이 가능하다.
- 이세돌 9단은 밥 한끼(약 20W)를 먹고 1,000개 뉴런을 가동할 수 있었지만, 알파고는 10만개의 뉴런을 흉내내기 위해 1,920개의 CPU와 280개의 GPU를 사용하여 1MW에 육박하는 엄청난 에너지를 소모하였다.
향후 데이터센터와의 연결 없이 Edge Device에서 인공지능 연산이 수행되는 지능형컴퓨팅 필요성이 대두되는 시대로 발전할 것이다. 지능형반도체란 데이터센터 서버 또는 에지 디바이스에서 인공신경망 알고리즘을 보다 효율적으로 계산하는데 최적화된 반도체를 말한다. 지능형반도체는 CPU, GPU, FPGA, ASIC/ASSP, Neuromorphic로 구분할 수 있다.
지능형반도체 기술 3가지 유형
기존 반도체 진화형 : CPU·GPU·FPGA 등이 이에 해당하며, 인텔·엔비디아·자일링스 등의 업체가 대표적이다.
- 상대적으로 가격이 싸고 범용성이 높다는 것이 장점이나, 인공지능 연산 성능과 소비전력 효율이 낮다는 것이 단점
1세대 지능형반도체 : 인공지능 연산 고속화를 위해 회로 구성을 최적화한 ASIC/ASSP가 이에 해당되면, 구글·인텔 등의 업체가 대표적이다.
- 인공지능 연산 성능과 소비전력 효율이 높지만, 가격이 비싸고 범용성이 낮아 디자인 된 알고리즘으로만 사용할 수밖에 없는 것이 단점
2세대 지능형반도체 : 인간 뇌를 모방한 비폰노이만 방식 뉴로모픽 반도체가 현재까지는 가장 진보된 형태의 지능형 반도체로 평가받고 있다.
지능형반도체 종류
GPU(Graphics Processing Unit) : 동시 계산 요구량이 많은 그래픽 영상 처리를 위해 고안된 병렬 처리 기반 반도체로 수천 개의 코어를 탑재하여 대규모 데이터 연산 시 CPU 대비 성능이 우수하지만 많은 양의 전력 소모와 발열 문제가 있다.
FPGA(Field Programmable Gate Array, 프로그래밍 가능한 반도체) : 회로 재 프로그래밍을 통해 용도에 맞게 최적화하여 변경이 가능한 반도체로 활용 목적에 따라 높은 유연성이 특징이다.
ASIC(Application Specific Integrated Circuit, 주문형 반도체) : Google의 TPU(TensorFlow Processor Units) 같은 사용자 지정 회로는 가장 높은 효율성을 제공한다. 그러나, 변하는 요구 사항에 따라 회로는 재구성이 불가능하며 응용 분야가 한정되어 있다.
ASSP, Aplication Specific IC : 범용반도체로서 전기밥솥, 디지털카메라 등 특정 분야에만 사용되는 반도체칩으로 응용분야가 한정된 반도체이다.
AP, Application Processor : 스마트폰, 태블릿 PC 등의 메인 칩을 의미하며 수많은 기능 모두를 하나의 칩으로 모아 놓은 칩이다.
Neuromorphic Chips, 뉴로모픽 반도체 : 기존 반도체 구조가 아닌 인간의 뇌를 모방한 非폰노이만 방식의 인공지능 전용 반도체로 연산처리, 저장, 통신 기능을 융합한 가장 복잡하고 진화한 반도체 기술이다.
지능형반도체의 활용
활용 목적 : 인공지능 반도체는 인공지능 시스템의 구현 목적에 따라 크게 학습용과 추론용으로 구분 할 수 있으며, 두 가지 과정을 반복 실행하여 최적의 답을 찾도록 성능을 강화하는데 주로 사용된다.
[학습용] 딥 러닝 등 기계학습의 특정 작업을 수행하기 위해 방대한 데이터를 통해 반복적으로 지식을 배우는 단계.
[추론용] 학습을 거친 최적의 모델을 통해 외부 명령을 받거나 상황을 인식하면 학습한 내용을 토대로 가장 적합한 결과를 도출하는 단계.
사용 환경 : 기존 인공지능 시스템은 주로 데이터센터에서 학습과 추론을 병행하여 사용되었으나, 스마트 폰 및 IoT 등의 보급 확산, 클라우드 기술 발전과 동시에 디바이스의 추론 기능의 수요가 증가하면서 이를 수행하기 위한 반도체 기술 중심으로 발전한다.
[데이터 센터용] 현재 인공지능 학습/추론은 대부분 데이터센터에서 실행되며 일반적인 하드웨어로는 CPU가 담당하고 있지만, 인공지능 서비스에 요구되는 대규모 연산 처리 성능을 위해 인공지능 반도체를 서버에 장착하여 활용.
데이터센터 전용 반도체는 방대한 데이터를 처리하기 때문에 발열과 전력소모로 인한 효율성 개선이 지속적으로 필요.
[엣지 디바이스용] 데이터센터 서버(클라우드)와 연결을 최소화하고 디바이스 자체에서 인공지능 연산이 수행되는 경우가 점차 확대되면서 소형화·저전력·고성능 중심의 인공지능 반도체 기술개발이 가속화.
지능형반도체의 진화 방향
일부 시장조사기관에서는 인공지능 반도체가 병렬연산처리에 최적화된 GPU 중심에서 초고성능·초 저전력 중심의 뉴로모픽 반도체로 기술이 진화할 것이라고 전망함.
1st Wave : 현재의 인공지능 반도체는 GPU 중심으로 데이터 센터 및 엣지 디바이스에 탑재되어 주로 활용
2nd Wave : 인공지능을 지원하는 저전력·고성능의 특화된 반도체인 ASIC 방식으로 변화될 전망
3nd Wave : 최종적으로는 추론·학습, 데이터 센터·디바이스 등 인공지능 시스템의 多기능을 지원하는 초저전력·초고성능의 뉴모로픽 반도체 중심으로 진화 전망
지능형반도체 테크놀러지
GPU : 게임 산업의 3D 그래픽 등을 처리하기 위해 개발되었으나 대규모 데이터의 연산을 효율적으로 처리하는 병렬처리 기반 반도체로 각광을 받으면서 인공지능 구현을 위한 핵심 반도체로 부상하였다.
* 직렬(순차) 처리 방식인 CPU는 한 개의 명령어에 의해 입력된 순서대로 데이터를 처리하는 반면, GPU는 여러 명령어를 동시에 처리할 수 있는 병렬 처리(Parallel Processing) 구조로 방대한 데이터의 연산을 지원하기 위한 반도체로 각광 받음
* CPU는 연산을 담당하는 ALU의 개수가 최적화된 소규모 코어로 구성되어있으며, GPU는 수천 개 코어로 구성됨
* GPU를 통해 기계학습(딥러닝 등)에 요구되는 복잡·고도화된 데이터 연산 처리의 성능 향상을 보여줌으로서 인공지능 구현의 발전을 견인
* GPU 기술은 NVIDIA社가 시장 선두 기업으로 데이터센터, 자율주행차 등 적용 분야에서 인공지능 반도체로 활용
* ’17년 GTC에서는 자율 주행차를 위한 AI Supercomputer chip, Xavier를 발표하면서 엣지 디바이스에 최적화된 반도체 기술을 선보임
FPGA : 활용 목적에 따라 재 프로그래밍이 가능한 반도체로서 개발에 투입되는 시간이 짧고 원하는 작업에 맞춰 연산 처리가 가능해 유연성이 높은 반도체로 각광받고 있으며 데이터센터 및 엣지 디바이스 등의 저전력화·고성능화를 위해 활용되고 있으며 글로벌 기업들의 기술 개발이 활발히 진행중인다.
* 기존 반도체들은 한번 생산되면 수정할 수 없지만 FPGA는 하드웨어를 재설계하지 않고 프로그래밍을 통해 사용 목적에 맞게 변경이 가능함 (예를 들어, FPGA는 번역 작업에 최적화해 사용하다가 반도체 회로 구성을 다시 설정해 가상비서 서비스에 맞춰 쓸 수 있음)
* 특정 목적에 맞춘 하드웨어 프로그래밍이 가능해 기계 학습을 통해 최적화된 학습모델의 출력 값을 빠르게 계산하는 인공지능 추론 서비스 구현에 적합하다는 평가를 받음
* 알고리즘을 수정하거나 연구개발 중일 때는 다른 인공지능 반도체에 비해 FPGA가 효율적
* CPU와 병렬로 작동하므로 시스템 혼란이나 병목현상 없이 사용 가능하여 최근 인공지능 구현을 위한 기술로 주목 받고 있음
* 자일링스社는 FPGA 시장에서 약 56% 점유율을 보유한 선두 기업으로 데이터센터 전용 반도체인 ‘reVISION’을 통해 머신 러닝, 데이터 분석 등과 같이 고성능 작업에 최적화된 제품으로 경쟁사 대비 2~6배의 컴퓨팅 성능을 발휘한다고 발표
* 데이터 센터에 있는 반도체를 FPGA로 통합하면 용도 재구성이 가능한 구조인 만큼 단일 서비스에 수천 개에 이르는 FPGA를 이용할 수도 있어 유연성이 뛰어남
* FPGA의 장점, 주문형 반도체(ASIC) 대비 개발 기간을 축소, 현장에서 수시로 오류를 수정할 수도 있어 개발비 절감 및 일반 제품보다 전력 효율성을 가지고 있음. ASIC 비해 생산단가가 높고 집적도가 떨어진다는 단점이 있음.
ASIC : 어플리케이션의 특성에 적합한 인공지능 시스템을 구현하기 위해 범용 프로세서를 사용하는 대신 특정 목적으로 제작되는 주문형 반도체 기술이 부상하고 있으며 전통적인 반도체 업체 외에도 다양한 산업체들은 인공지능 알고리즘이 내장된 ASIC 반도체를 자체 개발하는 추세이다. 특정한 용도에 맞도록 제작된 주문형 반도체인 ASIC는 빠른 속도와 높은 에너지 효율의 특성을 지니고 있어 인공지능 전용 반도체로 각광받고 있음
ASIC은 다른 인공지능 전용 반도체에 비해 비용이 높고 개발 기간이 길며, 한번 제품을 만들고 나면 기능을 바꿀 수 없지만 범용 프로세서(CPU, GPU)나 FPGA보다 성능 개선에 유리함
* ASIC은 개발이 끝난 알고리즘의 전력 소모량을 줄여야하는 기기에 도입할 때 효율적임
* 구글은 인공지능 딥러닝을 구현하기 위해 가장 널리 이용되는 SW 플랫폼인 오픈소스기반 ‘텐서플로’를 구현하는데 최적화된 하드웨어를 자체 개발
* 바이두社는 최근 AI 개발자 컨퍼런스 행사에서 AI 연산용 ASIC ‘쿤룬(Kunlun)’을 공개하였으며, 260 TFLOPS수준으로 초당 512GB 데이터를 주고받으며 무인자동차부터 데이터센터까지 모든 곳에 사용 가능
* ASIC의 주문형 반도체는 생산 단가가 낮고 집적도가 높은 장점과 개발기간이 길고 초기투자비용이 많이 든다는 단점을 가지고 있음.
뉴로모픽 : ‘폰 노이만(Von Neumann)’ 구조의 기존 반도체 한계를 극복하기 위해 인간처럼 저 전력으로도 고성능의 인공지능을 수행하는 반도체 기술이 각광을 받기 시작하였고 뉴로모픽 반도체 안에는 여러 개의 ‘코어(Core)’들이 존재하며, 코어에는 트랜지스터를 포함한 몇 가지 전자 소자들과 메모리 등이 탑재된다.
* 기억장치(메모리)·중앙처리장치(CPU)·입출력장치(IO) 등 3단계 구조로 명령을 순차적으로 수행하는 방식의 ‘폰 노이만’ 구조는 복잡한 작업일수록 시간이 오래 걸리고 에너지 소모가 크게 증가하는 구조 임
* 산업연구원에 따르면 폰 노이만 구조는 인간의 뇌와 같은 정보처리를 위해 필요한 소비전력을 감당하기 위해선 원자력발전소 1기가 필요하다고 언급
* 코어의 일부 소자는 뇌의 신경세포인 뉴런의 역할을 담당하며, 메모리 반도체는 뉴런과 뉴런 사이를 이어주는 시냅스 기능을 담당
* 인공 뉴런 역할을 하는 코어를 사람의 뇌처럼 병렬로 구성하였기 때문에 적은 전력만으로 많은 양의 데이터 처리가 가능하며, 인간의 뇌처럼 학습하기 때문에 연산 성능이 대폭 향상