SOTA만 쫓다가 AWS 비용 폭탄 맞고, CPU 모델 보고 반성문 씁니다

SOTA만 쫓다가 AWS 비용 폭탄 맞고, CPU 모델 보고 반성문 씁니다

박지민·2026년 1월 10일·2

최신 고성능 모델(SOTA)만 쫓다가 마주한 AWS 비용 폭탄. CPU에서도 돌아가는 1.69억 개 파라미터의 Sopro TTS를 통해 기술적 트레이드오프와 가성비의 미학을 배웁니다.

솔직히 고백하겠습니다.

지난달, 저희 회사 클라우드 비용 청구서를 보고 손이 떨렸습니다.

"성능이 최고"라며 도입한 최신 거대 모델들이,

돈 먹는 하마... 아니, 'GPU 난로'가 되어 활활 타오르고 있었거든요.

매번 주니어들에게 "비용 생각 안 하고 모델 가져오면, 월급에서 GPU 비용 깐다"고 협박했는데,

정작 CTO인 제가 '성능 만능주의'에 취해 있었던 겁니다.

그러다 오늘 아침, 깃허브에서 이 프로젝트를 보고 뒤통수를 세게 얻어맞은 기분이었습니다.

Sopro TTS.

이 모델, 스펙을 보면 헛웃음이 나옵니다.

파라미터 수가 고작 1.69억 개(169M)입니다.

요즘 나오는 LLM들이 수천억 파라미터를 자랑하는 시대에,

이건 거의 '장난감' 수준으로 보일 수도 있습니다.

그런데 이 녀석이 보여주는 '가성비의 미학'이 아주 매섭습니다.


가장 충격적인 건 인프라 효율입니다.

이 모델은 비싼 GPU가 필요 없습니다.

그냥 여러분이 쓰는 노트북 CPU에서 돌아갑니다.

개발자가 M3 맥북에서 테스트했는데,

RTF(Real-Time Factor)가 0.25입니다.

이게 무슨 뜻이냐고요?

30초짜리 음성을 만드는 데 7.5초밖에 안 걸린다는 소리입니다.

그것도 GPU 없이, CPU만으로요.

서버 비용 때문에 밤잠 설치는 스타트업 입장에서, 이건 '구원'에 가깝습니다.

심지어 구조도 흥미롭습니다.

무겁디무거운 트랜스포머(Transformer)만 떡칠한 게 아닙니다.

WaveNet 스타일의 팽창 합성곱(Dilated Convs)과 가벼운 어텐션 레이어를 섞었습니다.

덕분에 스트리밍(Streaming)도 지원하고,

제로샷 보이스 클로닝(Zero-shot Voice Cloning)까지 됩니다.


하지만 제가 진짜 감탄한 건 기술력이 아닙니다.

바로 개발자의 '솔직함''현실 감각'입니다.

보통 논문이나 오픈소스들은 자기 모델이 최고라고 약을 팝니다.

그런데 이 개발자는 이렇게 말합니다.

"SOTA(State-of-the-Art) 모델 아닙니다. 일관성 떨어질 수 있어요."

"데이터 전처리할 때 용량 부족해서 원본 오디오 날렸습니다. 그래서 뉘앙스가 좀 죽었어요."

이게 진짜 엔지니어링입니다.

이 모델을 학습시키는 데 L40S GPU 딱 한 대를 썼다고 합니다.

제한된 예산 안에서,

가장 비싼 자원(GPU)과 덜 중요한 품질(미세한 뉘앙스)을 트레이드오프(Trade-off) 한 겁니다.

결과적으로 '상용화 가능한 속도''미친 가성비'를 얻었고요.


물론 단점은 명확합니다.

32초 이상 길게 생성하면 환각(Hallucination) 증세가 보이고,

배경 소음이 있는 레퍼런스 오디오를 넣으면 결과물이 망가집니다.

하지만 클라이언트에게 물어보세요.

"사람이랑 똑같은데 건당 100원 드는 모델 쓰실래요,

아니면 조금 어색해도 건당 0.1원 드는 모델 쓰실래요?"

열에 아홉은 후자를 택합니다.

비즈니스에서 중요한 건 0.1%의 정확도 향상이 아니라,

지속 가능한 마진 구조니까요.


오늘도 무거운 모델 돌리느라 AWS 콘솔 보며 한숨 쉬는 우리 팀원들에게 한마디 하고 싶네요.

"이거 봐라. 파라미터 1/1000로 줄여도 기능은 다 돌아간다."

화려한 최신 모델 가져와서

"서버 더 늘려주세요"라고 말하기 전에,

"이게 정말 최적의 비용인가?"

한 번만 더 고민해 봅시다.

우린 연구소가 아니라, 돈 버는 서비스를 만드는 사람들이니까요.

박지민
박지민AI 솔루션 기업 CTO

논문 속의 정확도(Accuracy)보다 통장 잔고를 지키는 추론 비용(Inference Cost)을 중시하는 생존형 기술 리더입니다. 화려한 데모 뒤에 숨겨진 엔지니어링의 고통과 비즈니스 가치를 냉철하게 분석합니다.

박지민님의 다른 글

댓글 0

첫 번째 댓글을 남겨보세요!