지디넷 | 네오와인, 엔비디아 쿠다 필요없는 NPU 선보여
페이지 정보
작성자 neowine
조회 180회 작성일 24-10-29 09:36
조회 180회 작성일 24-10-29 09:36
본문
온 디바이스 AI 반도체 국산화 일환...30일 개막 AIoT 전시회서 'YOLO-v8' 버전 데모한국무역협회에 따르면 지난 2022년 기준 세계 반도체 시장(5957억 달러)은 메모리 반도체가 약 24%(1440억 달러), 시스템 반도체가 약 61%(3605억 달러)다. 시스템 반도체 시장이 메모리 반도체의 약 3배에 달한다. 시스템 반도체 국가별 시장 점유율은 한국반도체산업협회 분석에 따르면 우리나라가 3.0%로 미국(70%)의 20분의 1에도 못 미친다. 일본(5.6%)의 2분의 1 정도이자, 중국·홍콩(5.2%)의 2분의 1 수준에 불과하다.
하지만 국내 중소기업의 시스템반도체 기술 고도화 노력은 계속되고 있다. 대표적인 곳이 네오와인(대표 이효승)이다. 국내 팹리스 시스템반도체 회사로 복제방지 보안반도체를 설계했고, 현재까지 1.3억개의 보안(security) 반도체를 제조해 수출했다. 네오와인은 오는 30일~11월1일 서울 코엑스에서 열리는 'AIoT 국제전시회'에 부스를 마련, 새로운 시스템반도체를 선보인다. 특히 이 제품은 미국 엔비디아의 쿠다(CUDA) 도움 없이도 동작하는 것으로 자체 설계한 NPU다. NPU는 AI가속기로 주목받는 칩이다.
보통 시스템 반도체에 탑재한 AI 기능 동작은 엔비디아의 GPGPU 그래픽 카드와 이 회사의 쿠다 프레임워크를 사용, 실행한다. 엔비디아는 세계 서버시장에서 80~90% 정도의 시장점유율을 갖고 있는데, 중앙 서버에 정보를 주지 않는 에지(Edge AI) 시장은 올해 249억 달러에서 2035년 3568억 달러로 성장, 매년 27.8% 성장할 전망이다.
하지만 국내 중소기업의 시스템반도체 기술 고도화 노력은 계속되고 있다. 대표적인 곳이 네오와인(대표 이효승)이다. 국내 팹리스 시스템반도체 회사로 복제방지 보안반도체를 설계했고, 현재까지 1.3억개의 보안(security) 반도체를 제조해 수출했다. 네오와인은 오는 30일~11월1일 서울 코엑스에서 열리는 'AIoT 국제전시회'에 부스를 마련, 새로운 시스템반도체를 선보인다. 특히 이 제품은 미국 엔비디아의 쿠다(CUDA) 도움 없이도 동작하는 것으로 자체 설계한 NPU다. NPU는 AI가속기로 주목받는 칩이다.
보통 시스템 반도체에 탑재한 AI 기능 동작은 엔비디아의 GPGPU 그래픽 카드와 이 회사의 쿠다 프레임워크를 사용, 실행한다. 엔비디아는 세계 서버시장에서 80~90% 정도의 시장점유율을 갖고 있는데, 중앙 서버에 정보를 주지 않는 에지(Edge AI) 시장은 올해 249억 달러에서 2035년 3568억 달러로 성장, 매년 27.8% 성장할 전망이다.
특히 최근 관심을 받고 있는 '욜로(YOLO)' 인공지능 모델은 You Only Look Once 라는 Object Detection 방법론 중 하나로, 에지AI 시장에 진출하기 위해서는 국산 NPU에서 AI 모델을 동작 시켜야 하는데, 우리나라는 인공지능 모델이 변경될 때마다 NPU에 적용하기 위한 컴파일러 기술이 부족, 엔비디아 소프트웨어를 사용하고 있다. 네오와인은 이 문제를 해결하기 위해 나선 기업이다. 최근 감시카메라 및 로봇 전문기업 세오를 비롯해 ISP 전문기업 디코드, 성균관대학교 반도체시스템공학과 신동군 교수와 함께 TVM 오픈소스 컴파일러를 적용해 최신모델인 YOLO를 지원하는 NPU를 개발했다. 이미지 사이즈는 640x640고, 이미지를 실시간으로 인식한다.
현재 네오와인은 컴파일러를 적용한 IP를 'YOLO-v8' 버전으로 고도화했다. 'YOLO-v8'은 빠르고 정확한 객체 탐지, 사용자 친화 설계, YOLO 이전 버전과 비교해 더 빠르고 더 작은 파라미터로 높은 성능을 만들어 낼 수 있다고 설명했다. FPGA(프로그래밍이 가능한 반도체) 성능 한계로 100MHz에서 동작하지만, AI SoC 적용으로 속도와 NPU IP 개수를 수백개로 증가시키면 세계수준의 인식속도를 만들 수 있다고 회사는 판단한다. 엔비디아 최신 GPU인 'B200(블랙웰 200)'은 최대 4GHz, 최대 1200W로 동작한다. 네오와인의 YOLO지원 NPU는 AI SoC 투자가 이뤄지면 초당 수천 프레임의 YOLO v8 처리 속도도 가능하다.
이효승 네오와인 대표는 "AI반도체 국산화를 위해서는 현재 엔비디아 GPU와 CUDA에 종속된 인공지능 모델로부터 소프트웨어와 GPU 설계 독립이 필요하다. AI 모델을 변경할 경우 엔비디아 프레임워크에 종속되지 않고 SW 와 HW 소스코드를 변경할 수 있어야만 자체적인 국산 SoC 설계를 할 수 있기 때문"이라면서 "인공지능 이미지 처리 속도를 높이기 위해서는 NPU의 단위 명령수행연산 모듈인 AI 오퍼레이터를 최적화해야 한다"고 강조했다. 이어 "하지만 국내에서 설계한 NPU는 엔비디아 CUDA에서 지원되지 않는다. 이 역할을 성균관대학교 신동군 교수의 TVM 컴파일러가 최적화하고 있으며, 소프트웨어와 하드웨어간 속도를 높이기 위한 NPU 연산자 설계방식을 빠르게 바꾸고 설계방식을 피드백 할 수 있다"고 설명했다.
네오와인은 과학기술정보통신부와 산업통상자원부의 인공지능 반도체 요소기술 개발지원 사업을 수주, 인공지능 반도체 NPU를 연구개발하고 있다. 이 대표는 "그동안 국내 비메모리 반도체에 대한 정부부처 지원 사업 성과가 네오와인 같은 소규모 중소기업을 통해서 차근차근 나타나고 있다"면서 "네오와인은 한국팹리스산업협회의 설계 공통 플랫폼을 위한 MPCs 분과위원회 위원장으로도 참여 중"이라고 밝혔다.
현재 네오와인은 컴파일러를 적용한 IP를 'YOLO-v8' 버전으로 고도화했다. 'YOLO-v8'은 빠르고 정확한 객체 탐지, 사용자 친화 설계, YOLO 이전 버전과 비교해 더 빠르고 더 작은 파라미터로 높은 성능을 만들어 낼 수 있다고 설명했다. FPGA(프로그래밍이 가능한 반도체) 성능 한계로 100MHz에서 동작하지만, AI SoC 적용으로 속도와 NPU IP 개수를 수백개로 증가시키면 세계수준의 인식속도를 만들 수 있다고 회사는 판단한다. 엔비디아 최신 GPU인 'B200(블랙웰 200)'은 최대 4GHz, 최대 1200W로 동작한다. 네오와인의 YOLO지원 NPU는 AI SoC 투자가 이뤄지면 초당 수천 프레임의 YOLO v8 처리 속도도 가능하다.
이효승 네오와인 대표는 "AI반도체 국산화를 위해서는 현재 엔비디아 GPU와 CUDA에 종속된 인공지능 모델로부터 소프트웨어와 GPU 설계 독립이 필요하다. AI 모델을 변경할 경우 엔비디아 프레임워크에 종속되지 않고 SW 와 HW 소스코드를 변경할 수 있어야만 자체적인 국산 SoC 설계를 할 수 있기 때문"이라면서 "인공지능 이미지 처리 속도를 높이기 위해서는 NPU의 단위 명령수행연산 모듈인 AI 오퍼레이터를 최적화해야 한다"고 강조했다. 이어 "하지만 국내에서 설계한 NPU는 엔비디아 CUDA에서 지원되지 않는다. 이 역할을 성균관대학교 신동군 교수의 TVM 컴파일러가 최적화하고 있으며, 소프트웨어와 하드웨어간 속도를 높이기 위한 NPU 연산자 설계방식을 빠르게 바꾸고 설계방식을 피드백 할 수 있다"고 설명했다.
네오와인은 과학기술정보통신부와 산업통상자원부의 인공지능 반도체 요소기술 개발지원 사업을 수주, 인공지능 반도체 NPU를 연구개발하고 있다. 이 대표는 "그동안 국내 비메모리 반도체에 대한 정부부처 지원 사업 성과가 네오와인 같은 소규모 중소기업을 통해서 차근차근 나타나고 있다"면서 "네오와인은 한국팹리스산업협회의 설계 공통 플랫폼을 위한 MPCs 분과위원회 위원장으로도 참여 중"이라고 밝혔다.
관련링크
- 다음글전자신문 | 시스템반도체 후발주자 韓, 'MPCs' 도입 시급 24.07.11