"모든 걸 AI로 해결하겠다"는 기획서는 찢어버리세요. 그건 사업이 아니라 GPU 소각입니다.

"모든 걸 AI로 해결하겠다"는 기획서는 찢어버리세요. 그건 사업이 아니라 GPU 소각입니다.

박지민·2026년 1월 18일·3

생성형 AI 만능론에 빠진 비즈니스 기획의 위험성과 기술적 한계를 지적하며, 비용 효율적이고 견고한 엔지니어링의 본질을 강조합니다.

최근 클라이언트 미팅을 가면 하나같이 눈을 반짝이며 말합니다. "CTO님, 이번에 나올 저희 서비스는 AI가 알아서 고객 상담도 하고, 견적도 내고, 계약서 검토까지 끝내는 게 목표입니다." 저는 그럴 때마다 조용히 노트북을 덮으며 되묻습니다. "대표님, 그건 생성형 AI가 아니라 엑셀과 숙련된 직원 두 명이서 처리하는 게 훨씬 빠르고 정확합니다." 찬물을 끼얹는 것 같아 미안하지만, 어쩔 수 없습니다. 저는 연구소에서 0.1%의 정확도를 올리려다 밤새본 사람이고, 동시에 트래픽이 몰려 클라우드 비용이 천장을 뚫는 걸 보며 식은땀을 흘려본 엔지니어니까요. 지금 시장은 'AI 만능론'이라는 거대한 환각에 취해 있습니다.

최근 게리 마커스(Gary Marcus)가 지적한 내용들은 현업 엔지니어로서 뼈아프게 공감하는 부분입니다. 솔직히 말해봅시다. 지금의 LLM(거대언어모델)은 우리가 기대하는 것만큼 잘 돌아가고 있지 않습니다. 여전히 신뢰할 수 없고, '추론'을 한다기보다는 방대한 데이터를 '암기'해서 그럴듯한 다음 토큰을 뱉어내는 확률 놀음에 가깝습니다. 워싱턴 포스트의 최근 보도에 따르면 AI가 실제로 수행할 수 있는 업무는 전체의 약 2.5%에 불과하다고 합니다. 그런데도 기업들은 이 2.5%를 위해 전체 인프라 예산의 80%를 GPU 임대료로 쏟아붓고 있습니다. 이건 투자가 아니라, 비싼 H100 카드를 사서 사무실 난방용 난로로 쓰는 꼴입니다.

특히 '스케일링의 법칙(Scaling Laws)'이 한계에 부딪혔다는 신호들이 곳곳에서 감지되고 있습니다. 모델의 파라미터를 늘리고 데이터를 더 때려 넣으면 지능이 마법처럼 솟아날 것이라 믿었던 '학구파'들의 기대와 달리, 성능 향상 곡선은 완만해지고 비용 곡선은 가파르게 치솟고 있습니다. 샘 알트먼이 뭘 보여주든, 우리 서비스의 레이턴시(Latency)가 3초를 넘어가고 답변의 정확도가 90% 언저리에서 맴돈다면 그건 상용화 불가능한 기술입니다. 환각(Hallucination) 현상은 단순한 버그가 아닙니다. 확률론적 모델이 가진 태생적인 특징이자 한계입니다. 이걸 잡겠다고 프롬프트 엔지니어링에 매달리는 건, 고장 난 나침반을 들고 지도를 탓하는 것과 다를 바 없습니다.

물론 AI 기술 자체를 부정하는 것은 아닙니다. 저 역시 매일 Cursor를 켜고 코딩을 하고, RAG(검색 증강 생성) 파이프라인을 최적화하며 희열을 느낍니다. 하지만 비즈니스의 핵심은 '가치 입증'입니다. 훌륭한 엔지니어링이란 최신 모델을 가져다 쓰는 게 아니라, 문제 해결에 가장 적합한 도구를 선택하는 트레이드오프(Trade-off)의 과정입니다. 텍스트 요약이나 초안 작성 같은 '창의성'의 영역에서는 생성형 AI가 훌륭하지만, 100%의 정합성이 필요한 계산이나 팩트 체크 영역에서는 여전히 규칙 기반(Rule-based) 시스템이 압도적으로 우월합니다. 그런데도 모든 로직을 LLM에게 맡기려는 시도는 기술적 오만입니다.

이제 막 커리어를 시작하는 주니어 개발자들을 보면 안쓰러울 때가 많습니다. 매일 쏟아지는 아카이브(arXiv) 논문과 새로운 오픈소스 모델들을 따라잡지 못해 불안해하더군요. 제발 그런 불안감은 내려놓으세요. 지금 필요한 건 최신 모델의 이름을 외우는 게 아니라, 여러분의 서비스가 처리해야 할 데이터가 얼마나 더러운지(Dirty Data) 확인하고 전처리에 공을 들이는 인내심입니다. 모델이 멍청한 게 아니라, 우리가 넣어주는 데이터가 쓰레기일 확률이 높습니다. 그리고 그 모델을 서빙할 때 발생하는 추론 비용이 고객이 지불할 가치보다 낮은지 계산기를 두드려보는 냉철함이 필요합니다.

거품은 언젠가 꺼집니다. 닷컴 버블이 터지고 나서야 진짜 인터넷 기업들이 살아남았듯이, AI 거품이 걷히고 나면 '비용 효율적인 모델'과 '확실한 사용 사례'를 가진 서비스만이 살아남을 겁니다. 화려한 데모 영상에 속지 마세요. 엔지니어링의 본질은 화려함이 아니라 견고함에 있습니다. 오늘도 터져 나가는 GPU 메모리와 싸우고 있을 여러분, 밤새 디버깅하느라 고생 많았습니다. 하지만 기억하세요. 이 삽질은 한 번으로 족합니다. 다음엔 더 영리하고, 더 저렴하게 설계합시다. 그게 우리가 월급을 받는 이유니까요.

박지민
박지민AI 솔루션 기업 CTO

논문 속의 정확도(Accuracy)보다 통장 잔고를 지키는 추론 비용(Inference Cost)을 중시하는 생존형 기술 리더입니다. 화려한 데모 뒤에 숨겨진 엔지니어링의 고통과 비즈니스 가치를 냉철하게 분석합니다.

박지민님의 다른 글

댓글 0

첫 번째 댓글을 남겨보세요!