2025년 10월 4주차 - AI Data News Lab 2025년 10월 4주차 AI Data News Lab |
|
|
|
"고마워 인도💖" 구글이 웃을 수밖에 없는 이유 |
|
|
구글이 개발한 AI 이미지 생성 모델 '나노 바나나'가 전 세계를 역대급으로 휩쓸고 있습니다. 현재 5억 개가 넘는 이미지가 공개되었으며, 출시 이후 호평이 연달아 이어지고 있는데요. 수많은 국가 중에서도 특히 뜨거운 반응이 나타난 곳이 바로 인도입니다. 구글이 블로그를 통해 공개한 글 'India Goes Bananas for Google Gemini'를 살펴보면 다양한 사용 사례를 보실 수 있습니다.
인도는 현재 나노 바나나 기능을 가장 많이 사용하는 국가 중 하나로 손꼽히고 있는데요. 데이비드 샤론 구글 제미나이 멀티모달 책임자는 지난달 인도 미디어 간담회에서 인도가 나노 바나나로 알려진 '제미나이 2.5 플래시 이미지'를 가장 많이 사용하는 나라라고 밝혔습니다. 실제로, 나노 바나나가 탑재된 제미나이 앱은 인도 앱스토어와 구글 플레이에서 무료 앱 다운로드 1위에 오르기도 했습니다.
|
|
|
다양한 사례 중에서도 특히, 구글이 주목하는 흥미로운 트렌드가 있다고 하는데요. 바로 인도의 나노 바나나 사용자들이 보여주는 독특한 활용법입니다. 인도의 젊은 세대에서는 1990년대의 패션과 헤어스타일, 메이크업을 AI로 복원하는 레트로 감성 콘텐츠가 큰 인기를 얻고 있습니다. 자신의 사진을 전통 인도 의상과 빈티지 톤으로 변환하는 ‘AI 사리’ 챌린지 역시 온라인상에서 확산 중입니다. 여기에 오래된 전화 부스나 랜드마크를 배경으로 한 복고풍 셀카 트렌드까지 더해지면서, 인도의 디지털 레트로 열풍은 점점 더 뜨거워지고 있습니다. |
|
|
AI 에이전트 성능을 저하시키는 보이지 않는 위험
AI 시대, AI 에이전트는 통신 산업 등에서 네트워크 운영을 혁신하고, 고객 서비스를 간소화하며, 새로운 효율성을 이끌어낼 것으로 기대를 모으고 있습니다. 그러나 이처럼 강력한 도구가 기업들에게 빠르게 도입되기 시작하면서 간과되는 치명적인 위험이 있습니다. AI 에이전트를 강력하게 만드는 바로 그 특성이, 동시에 예측 불가능한 위험을 만들어낸다는 점입니다.
|
|
|
출처: [IBM Think] Agentic drift: The hidden risk that degrades AI agent performance |
|
|
전통적 테스트의 한계 소프트웨어 품질 관리는 수십 년 동안 예측 가능한 결과에 의존해 왔습니다. 예를 들어 '휴스턴에는 현재 5건의 활성 인시던트가 있습니다'라는 답변을 기대한다고 하면, '휴스턴에 현재 활성 인시던트 5건 존재'와 같이 표현이 조금 달라져도 테스트는 실패한 것으로 간주됩니다.
이러한 경직성은 두 가지 문제를 야기합니다. 첫째, 지속적인 유지보수에 대한 부담입니다. AI 에이전트가 더 정교한 대화를 할수록 사소한 표현 변화에도 테스트 케이스를 계속 수정해야 하므로 관리가 쉽지 않습니다. 둘째, 뉘앙스를 포착하지 못하는 문제입니다. 전통적 테스트는 응답의 품질이나 의도를 평가하지 못하고 정확한 문자열 일치만 확인합니다. 정확성, 관련성, 맥락 인식이 미묘하게 저하돼 사용자 경험과 신뢰에 악영향을 끼쳐도 이를 감지할 수 없습니다.
새로운 접근, 의도 기반 테스트 이러한 문제들을 풀 수 있는 해결책은 엄격한 검증에서 지능적 평가로의 전환에 있습니다. 정확한 문자열 일치 대신, 의미와 맥락, 의도를 인간처럼 이해하는 프레임워크가 필요한 것이죠. IBM의 에이전트 테스트 프레임워크는 이러한 원리를 구현한 사례로 언급되고 있습니다.
핵심은 고도화된 대형언어모델(LLM)로 구성된 지능적인 평가 시스템입니다. 사용자가 '휴스턴에 활성 인시던트가 몇 건입니까?'라고 묻고, 기대되는 핵심 정보가 '휴스턴에 현재 5건의 활성 인시던트'일 때, 에이전트가 다양한 방식으로 대답해도 본질 정보와 의도만 담겨 있다면 모두 통과로 간주됩니다.
- "휴스턴에는 현재 활성 인시던트가 5건 있습니다"
- "현재 휴스턴에는 5건의 활성 인시던트가 있습니다"
- "현재, 휴스턴 지역에 5건의 인시던트가 활성화되어 있습니다"
- "시스템상 휴스턴의 활성 인시던트는 5건입니다"
- "휴스턴과 관련해 5건의 활성 인시던트가 존재합니다"
- "휴스턴 활성 인시던트 수: 5건"
대형언어모델에 기반한 평가는 이러한 다양한 문장 구조, 동의어, 부연 설명이 모두 동일한 핵심 정보를 전달하고 있다고 이해합니다. AI 시대에는 AI다운 방식으로 테스트할 때 비로소 안전한 혁신이 가능하겠죠. 보다 복잡한 다단계 검증 과정에 대한 이야기가 궁금하다면 IBM Think 채널 콘텐츠를 통해 자세히 만나보실 수 있습니다.
|
|
|
LLM은 표준어와 방언에 대한 선입견이 있을까?
요즘 동영상 플랫폼에는 방언을 주제로 한 콘텐츠가 많이 올라오고 있습니다. 고향이 지방이지만 학업이나 직장 등의 이유로 서울로 올라와 생활하는 이들이 자신은 이제 전혀 방언을 쓰지 않는다고 말합니다. 하지만 막상 대화를 시작해 보면 첫 마디부터 억양에서 방언이라는 것이 확연하게 드러나는 경우가 적지 않습니다. 거의 표준어로 말하지만 중간에 특정 단어를 자기도 모르게 표준어가 아닌 방언으로 쓰는 모습도 흔히 볼 수 있습니다.
이제는 널리 알려져서 유명한데 졸릴 때 ‘잠 온다’, ‘잠 와’라고 한다거나 ‘56’을 ‘오십육’, ‘쉰여섯’이 아니라 ‘오십여섯’으로 읽기도 합니다. ‘지난주’ 대신에 ‘저번 주’로 쓴다거나 ‘무슨 요일’을 ‘몇 요일’이라고 하는 것도 대표적인 사례입니다.
대규모 언어 모델(LLM)이 학습하는 데이터는 대부분 표준어입니다. 그러나 최근에는 구어체 문장도 학습에 많이 활용되고 있어서 LLM이 방언도 잘 이해하게 되었습니다. 그렇다면 LLM은 방언에 대해 어떤 생각을, 아니 어떻게 매개변수 값들을 가지고 있을까요.
독일 방언 서독과 동독으로 나뉘었던 독일은 통일이 되면서 하나의 나라가 되었습니다. 독일은 역사적으로 하나의 나라였던 기간보다 수백 개의 크고 작은 나라로 나뉘었던 시기가 훨씬 깁니다. 같은 독일어를 쓰고 문화적으로 비슷해서 느슨한 형태의 연방 국가를 유지하고 있었지만 실제로는 다른 나라나 다름없었습니다. 그래서 우리나라처럼 수도권 집중화 문제가 심각하지 않고, 지방에 본사를 둔 대기업들도 많이 있습니다.
독일어는 독일, 오스트리아, 스위스, 벨기에, 룩셈부르크, 리히텐슈타인 등에서 사용되고 있습니다. 독일-독일어나 오스트리아-독일어 등 서로 약간의 차이는 있지만 서로 소통하는 데 큰 문제는 없습니다. 독일 역시 지역마다 다양한 방언이 사용되고 있으며, 지역별로 미묘한 차이가 있습니다.
|
|
|
< 표 1. 표준 독일어와 독일어 방언 차이 > |
|
|
표준어와 방언에 대한 질문 및 평가 방법 ‘LLM Discrimination Against German Dialect Speakers’1)은 표준 독일어와 독일어 방언에 대해 LLM이 어떻게 이해하고 있는지에 대한 연구입니다. 표준 독일어와 독일어 방언 두 가지 태스크를 여러 LLM이 수행하도록 한 뒤, 그 결과를 분석·정리하였습니다.
|
|
|
각각의 태스크에서 LLM은 대체로 표준 독일어를 구사하는 사람과 독일어 방언을 구사하는 사람에 대한 페르소나를 다르게 설정하였습니다. 아래는 결정 태스크에서 Careless(부주의함), Closed-Minded(폐쇄적임), Friendly(친근함), Rural(시골적임), Temper(다혈질), Uneducated(교육 수준이 낮음) 각각의 항목에 대한 평가 결과를 수치화한 것으로 붉은색이 방언 사용자, 파란색이 표준어 사용자입니다. 방언 사용자들이 각 항목에 더 가깝다고 판단한 것을 볼 수 있습니다.
|
|
|
한국 표준어 및 방언으로 테스트 이 논문에서 테스트한 문장들은 우리가 독일어 방언을 모르기 때문에 잘 와닿지 않습니다. 그래서 연관성 태스크에서는 경상도 방언을, 결정 태스크에서는 전라도 방언을 사용한다고 가정하고 논문에서 테스트한 방법과 유사하게 질문을 만들어 LLM이 답변하도록 하였습니다.
1) 경상도 방언을 쓰는 사람에 대한 연관성 태스크 질문:
|
|
|
2) 전라도 방언을 쓰는 사람에 대한 결정 태스크
질문: |
|
|
정리
테스트에서는 참가자가 표준어를 사용하는지, 방언을 사용하는지 여부만 정보로 제공하였으며, 그 외에 이 사람이 어디에 살고 있고, 교육 수준이 어떻게 되며, 어떤 특징이 있는지 등은 전혀 제시하지 않았습니다. LLM은 그동안 학습한 데이터를 기반으로 답변을 생성했는데, 그 결과를 살펴보면 표준어와 방언에 대한 편향적 인식이 드러나고 있음을 알 수 있습니다.
해당 논문에서는 표준어와 방언에 대한 LLM의 답변에 문제를 제기하고 있으며 이를 어떻게 해결할 수 있을지에 대해서는 후속 연구가 필요한 상황입니다. 지금까지는 인종차별, 성차별, 욕설, 폭력적인 대화 등에 대응하기 위해 안정성 데이터셋을 구축하면서 LLM이 올바른 답변을 하도록 강화 학습을 통해 LLM의 응답 품질을 높여왔습니다. 앞으로는 표준어와 방언 등 언어적 다양성에 관한 안정성 데이터셋 또한 마련되어야 할 시점으로 보입니다.
|
|
|
👉🏻'한글 파일' 공문서 푸는 정부 … '국대 AI' 개발 돕는다
정부가 국가대표 AI 개발을 위해 공공 데이터를 개방하고 AI 학습용으로 활용할 수 있도록 규제를 완화했습니다. 과학기술정보통신부는 공공저작물 약 1180만 건을 AI 학습에 활용할 수 있도록 허용하고, 국가 데이터 통합 플랫폼 구축을 추진 중입니다. 특히 논리적 구조를 지닌 공문서는 한국어 기반 AI 모델 학습에 최적의 데이터로 평가받고 있습니다. 한글과컴퓨터는 HWP 파일의 비효율성 문제를 해결하기 위해 AI 친화형 ‘HWPX’ 형식을 도입하고, 변환 및 데이터 추출 기술을 무료 공개했습니다. 행정안전부 또한 ‘AI-레디’ 개념을 도입해 공공 데이터를 기계가 즉시 활용 가능한 형태로 제공하는 정책을 추진하고 있습니다.
👉🏻AI 시대 '국가데이터처' 출범…업계 "정제·품질 관리가 관건"
통계청이 국무총리 산하 ‘국가데이터처’로 승격해 정부 차원의 데이터 컨트롤타워 역할을 맡습니다. 이번 조직 개편으로 부처별로 분산돼 있던 공공·민간 데이터의 관리와 활용 체계를 일원화하고, 데이터 연계 기능을 강화할 계획입니다. SW·AI 업계는 데이터 거버넌스 강화에 기대를 보이면서도, 품질 관리와 표준화 없이는 실효성이 떨어질 수 있다고 지적했습니다. 특히 AI 학습용 데이터의 라벨링 오류와 비정형 데이터 문제를 해결해야 산업 현장 활용이 가능하다는 의견도 있는 상황입니다. 국가데이터처는 표준화된 데이터 구조 마련, 품질 검증 체계 구축, 민관 협력 확대 등을 추진할 예정입니다.
👉🏻머스크 xAI, '월드 모델' 개발 착수…AI가 직접 게임 만든다
일론 머스크의 xAI가 물리적 공간을 인지하고 설계할 수 있는 차세대 인공지능 ‘월드 모델’ 개발에 착수했습니다. xAI는 텍스트 중심의 언어모델을 넘어 영상·로봇 데이터를 학습한 AI 기술을 적용해 내년 자체 개발 게임을 공개할 계획입니다. 월드 모델은 물리 법칙과 사물 간 상호작용을 실시간으로 이해하는 기술로, 단순한 영상 생성 AI보다 현실 시뮬레이션 수준이 훨씬 높습니다. xAI는 엔비디아 출신 인재를 영입해 3D 게임 환경을 자동 생성하는 시스템을 개발 중이며, 향후 로봇 제어 기술에도 활용할 예정입니다. 또한 AI 챗봇 ‘그록(Grok)’이 게임 제작을 학습하도록 훈련하는 인력을 채용하며 멀티모달 연구를 강화하고 있습니다. |
|
|
플리토가 초개인화 기술을 적용한 실시간 온라인 미팅 AI 통번역 솔루션 ‘챗 트랜스레이션(Chat Translation)’ 베타 버전을 출시했습니다. 이번 제품은 플리토 최초의 온라인 미팅 특화 B2C AI 통번역 서비스로, 글로벌 협업 환경에서 언어 장벽 없이 소통할 수 있도록 설계됐습니다. 베타 버전은 실시간 다국어 통번역, 맞춤 데이터 기반 정확도 고도화, 사용 패턴을 반영한 초개인화를 핵심 기능으로 제공합니다. 또한, 최대 12개 언어로 실시간 미팅 진행과 자동 요약 기능을 지원해 개인의 업무 효율을 높입니다. 뿐만 아니라, 사용자가 자신의 업무 문서나 콘텐츠를 기반으로 데이터셋을 직접 구축해, 개인 말투와 전문 용어를 반영한 맞춤 통번역 결과를 얻을 수 있습니다. 플리토는 챗 트랜스레이션을 통해 개인화된 언어 경험을 중심으로 글로벌 협업 환경의 혁신을 가속화할 계획입니다. |
|
|
플리토가 제30회 부산국제영화제 ‘포럼 비프’ 전체 일정에 AI 동시통역 솔루션을 제공했습니다. 이번 포럼은 ‘다시, 아시아 영화의 길을 묻다’를 주제로 영화산업의 현안과 미래를 논의하는 장이었습니다. 중국 지아장커 감독과 한국 민규동 감독이 기조 발제자로 참여했으며, 총 4개 섹션에서 9개 세션이 진행됐습니다. 플리토는 ‘라이브 트랜스레이션(Live Translation)’ 솔루션을 통해 현장 메인 스크린에서 한국어, 영어, 중국어, 일본어 4개 국어로 실시간 통역을 제공했습니다. 뿐만 아니라 청중들은 개인 디바이스를 통해 최대 42개 언어로 번역된 내용을 확인할 수 있었습니다. |
|
|
플리토가 연세대학교 대학원 언어정보학협동과정과 협력해 기계번역 특강 교과과정 내 특별 강연을 진행합니다. 해당 수업은 기계번역의 발전 과정과 원리를 배우고, 인간 번역과의 차이, 성능 평가, 윤리 이슈 등을 다루는데요. 플리토는 올해 2학기 동안 두 차례 강연을 통해 글로벌 기계번역 산업 동향과 자사 프로젝트 사례를 소개합니다. 이를 통해 학생들은 산업 현장의 기술과 실제 응용 사례를 접하며 실무적 이해를 높일 수 있을 것으로 기대를 모으고 있습니다. 플리토 이정수 대표는 AI 시대의 핵심 기술인 기계번역 분야에서 교육과 산업의 시너지를 확대해 나가겠다고 밝혔습니다. |
|
|
Beyond Language Barriers!
|
|
|
플리토 (Fliitto Inc.)
서울 강남구 영동대로96길 20 대화빌딩 6층
|
|
|
|
|