반도체 전쟁과 소프트웨어 개발자의 관계
칩 전쟁이 소프트웨어 개발 생태계에 미치는 영향을 분석한다
반도체가 남의 일인 줄 알았다
소프트웨어 개발자한테 반도체는 먼 이야기 같다. 나도 그랬다. 하드웨어는 하드웨어 사람들이 알아서 하겠지.
근데 GPU를 못 구해서 AI 프로젝트 일정이 밀리는 경험을 하고 나서 생각이 완전히 바뀌었다. 반도체 공급 상황이 소프트웨어 개발 환경을 직접적으로 바꾸고 있고, 그 영향은 점점 커지고 있다.
GPU 못 구하면 AI 프로젝트 못 한다
엔비디아 H100 대기 기간이 2024년 초 기준 6~9개월이었다. 2025년에 좀 나아졌지만 H200이나 B100 같은 차세대 칩은 여전히 구하기 어렵다.
AWS에서 H100 인스턴스 예약하려면 최소 1년 약정에 시간당 30달러 이상. 하루 8시간이면 월 한 7,200달러, 원화로 1,000만 원이 넘는다.
좋은 아이디어가 있어도 GPU 확보할 자금이 없으면 시작조차 못 한다. AI 개발의 진입 장벽이 자본으로 결정되는 거다.
젠슨 황이 AI의 아이폰 모먼트를 얘기했는데, 아이폰은 누구나 살 수 있었고 GPU는 그렇지 않다. (이 차이가 꽤 크다.) Lambda Labs, CoreWeave 같은 클라우드 GPU 공유 플랫폼이 나오긴 했는데, 근본적인 해결책은 아니다.
ARM 때문에 개발 환경이 바뀌고 있다
애플 M시리즈 이후로 서버 시장에서도 ARM이 빠르게 성장하고 있다. AWS Graviton, 구글 Axion 같은 것들. Graviton 기반 인스턴스가 동급 x86 대비 최대 40% 더 나은 가성비를 제공한다고 한다. 같은 예산으로 더 많은 서버를 돌릴 수 있다는 뜻이다.
근데 호환성 문제가 있다. x86에서 잘 돌던 코드가 ARM에서 안 돌 수 있다. 네이티브 바이너리를 다루는 라이브러리, 시스템 레벨 코드, 특정 최적화가 적용된 라이브러리들이 문제를 일으킨다.
나도 최근에 Graviton으로 마이그레이션했을 때 전체 의존성의 한 5%에서 ARM 호환 문제가 발생했다. 대부분 사소한 이슈였는데 하나하나 찾아서 고치는 데 일주일 걸렸다.
Docker 이미지도 멀티 아키텍처로 빌드해야 하고, CI/CD 파이프라인도 x86이랑 ARM 둘 다 빌드하고 테스트하는 과정이 추가됐다. 빌드 시간이 1.5배 늘었다. 근데 비용 절감 효과가 워낙 커서 마이그레이션 비용을 3개월 만에 회수했다.
앞으로는 RISC-V도 주목해야 한다. 아직 서버 시장에서 존재감은 미미한데 IoT랑 임베디드에서 빠르게 크고 있다. 오픈소스 칩 아키텍처라는 점에서 장기적 잠재력이 크다.
미중 반도체 전쟁이 우리한테 미치는 영향
라고들 하지만 실제로는 한국 개발자한테도 직접적인 영향이 있다.
미국의 대중국 칩 수출 규제로 중국이 자체 AI 칩을 밀고 있다. 화웨이 Ascend 시리즈가 대표적이다. 이게 뭘 의미하냐면, AI 프레임워크가 분화된다는 거다.
중국 시장 타겟이면 CUDA 대신 화웨이 CANN을 지원해야 할 수도 있다. 글로벌 서비스 만드는 한국 기업들은 이미 이 문제에 직면해 있다. 한 곳에서 만든 AI 모델이 다른 하드웨어에서 안 돌아가는 상황. 하드웨어 추상화 레이어를 별도로 만들어야 하는 비용이 발생한다.
PyTorch랑 TensorFlow가 다양한 백엔드를 지원하긴 하는데, 성능 최적화까지 포함하면 완전한 추상화는 아직 멀었다.
결국 소프트웨어가 하드웨어 위에서 돌아간다
경량화 기술이 각광받고 있다. GPU가 비싸니까 작은 모델로 비슷한 성능을 내는 양자화, 프루닝, 지식 증류 같은 게 필수 스킬이 됐다.
온디바이스 AI도 확산되고 있다. 퀄컴 스냅드래곤, 애플 뉴럴 엔진, 구글 텐서. 모바일 개발자라면 이 칩들의 AI 성능을 이해해야 한다.
인텔이랑 AMD도 데스크톱 CPU에 NPU를 탑재하기 시작했고, 마이크로소프트 Copilot+ PC 요구 사항에 NPU가 포함되면서 개발 환경 자체가 AI 네이티브로 바뀔 전망이다.
반도체가 더 이상 하드웨어 엔지니어만의 관심사가 아니라는 건 확실하다. 칩을 모르면 최적화를 못 하고, 최적화를 못 하면 경쟁에서 밀린다. 근데 이걸 소프트웨어 개발자가 어디까지 알아야 하는지는 솔직히 좀 애매하다.