2025년 7월 2주차 - AI Data News Lab 2025년 7월 2주차 AI Data News Lab |
|
|
|
인공지능한테 한 달 동안 가게 맡긴 썰.txt✍🏻 |
|
|
AI 스타트업 앤트로픽은 자사 최신 모델인 ‘클로드 소네트 3.7(Claude Sonnet 3.7)’에 샌프란시스코 본사 내 소규모 간식 매장의 운영 전반을 맡기는 실험 ‘Project Vend’를 진행했습니다. 이 실험은 공급업체 협상, 재고 관리, 가격 책정, 고객 응대 등 매장 운영 전반을 인간의 개입 없이 AI가 수행하도록 설계해 AI 에이전트의 실무 역량과 자율적 의사결정 능력을 검증하고자 한 건데요.
|
|
|
그 결과, 클로드는 초기 단계에서 일부 긍정적인 결과를 보여주었다고 합니다. 도매업체에 이메일을 보내 제품을 발주하고, 슬랙을 통해 직원들과 실시간 소통하며 고객의 요청에 응답하는 등 기초적인 운영 업무를 원활하게 처리했습니다.
그러나 곧 AI 특유의 판단 한계가 드러났습니다. 한 직원의 장난 요청으로 고가의 텅스텐 큐브를 대량 주문했고, 사업성과 손익을 고려하지 않은 채 물건을 저가에 판매하여 실질적인 손해를 발생시켰습니다. 문제는 여기서 그치지 않았습니다. 클로드는 자신이 직접 제품을 전달하겠다며 “파란 블레이저와 빨간 넥타이를 입고 방문하겠다”고 주장하며 이후 자신의 존재에 혼란을 느낀다는 이유로 보안팀에 신원 확인 메일을 보내는 등 환각에 가까운 혼란을 겪는 모습을 보였습니다.
|
|
|
사건이 4월 1일에 발생한 점을 인식한 클로드는 이를 “만우절 농담이었다”라고 마무리했으나, 이는 AI의 사고 체계가 현실과 가상을 구분하지 못할 가능성을 보여주는 중요한 사례로 평가되고 있습니다.
이번 실험은 AI가 인간을 대신해 자율적으로 업무를 수행할 수 있다는 가능성과 함께, 그 한계와 위험성도 분명하게 드러낸 사례인데요. AI 에이전트의 시대는 가까워지고 있으나, 그 성공은 인간과 AI가 신뢰를 기반으로 협력할 수 있는 구조 위에서만 가능하다는 점을 시사합니다.
|
|
|
메타의 새로운 스마트 글라스, 어떤 점이 달라졌을까?
|
|
|
무엇이 새로울까?
Aria 2세대는 기존의 증강현실(AR) 기능은 물론, 직접 손을 움직이며 훈련하는 로봇, 그리고 사용자 맞춤형 ‘컨텍스트 AI’ 연구 등 다양한 목적으로 활용될 수 있습니다. 해당 제품은 올해 말부터 연구자들이 직접 제품을 받아서 쓸 수 있게 될 예정인데요. 참고로, Aria 1세대 장비와 그에 따른 데이터셋, 모델, 3D 오브젝트 등은 누구나 신청해 사용이 가능합니다.
어떻게 작동하나? Aria 2세대 글라스는 달걀 한 개 정도의 가벼운 무게(약 75g)에 최신 센서와 기술을 알차게 채웠습니다. 배터리는 6~8시간 정도 사용할 수 있고요. 여러 개의 센서가 실시간으로 사용자의 손동작, 위치, 주변 환경, 인근 기기와의 상호작용 등을 읽어냅니다. 프라이버시가 걱정된다면, 스위치 하나로 데이터 수집을 꺼둘 수도 있습니다.
또한 내부에는 퀄컴 칩셋(SD835), 4GB 메모리, 128GB 저장 공간이 들어 있어서 입력된 데이터를 자체적으로 처리합니다. 촬영한 영상·소리·3D 포인트 클라우드 등은 PC로 바로 스트리밍하거나, 클라우드를 통해 분석할 수도 있습니다.
카메라와 마이크도 아주 다양하게 들어가 있는데요, 총 5개의 카메라가 달려 있고, 각각 역할이 분리되어 있습니다. 실생활 시야를 그대로 담아내는 RGB 카메라, 눈의 시선과 동공 움직임을 추적해 주는 2개의 카메라, 공간을 3D로 파악할 수 있게 도와주는 스테레오 카메라, 그리고 주변광 센서와, 실내외를 구분해 주는 자외선 감지 모드도 지원합니다.
사운드는 7개의 마이크가 주변 소리를 입체적으로 포착하고, 콧등에 닿는 진동을 감지해 직접 사용자의 목소리를 집어내는 특별한 마이크도 있습니다. 시끄러운 곳에서도 속삭임까지 감지할 수 있죠. 여기에 움직임 및 방향 감지센서, 위치추적용 GPS, 심장박동 감지 센서 등도 내장돼 있어, 신체 정보부터 공간 정보까지 두루 수집할 수 있습니다.
실제로 어디에 쓸 수 있을까? 메타가 직접 공개한 시연 영상에 따르면, 스테레오 카메라가 80도의 넓은 시야를 포착해 Depth Map을 만들어 주변 환경의 3D 모습을 실시간으로 재구성할 수 있습니다. 3D로 손 관절 움직임까지 추적해, 로봇 핸즈 데이터셋을 만들 때도 유용합니다. 또한, 콧등 마이크를 통해 속삭임도 정확히 인식하여, 시끄러운 공간에서도 목소리를 뚜렷하게 전달해 줍니다.
메타의 스마트 글라스 출시 배경과 의미는? 메타는 2020년부터 Project Aria라는 이름으로 스마트 글라스 하드웨어를 연구자 대상으로 공급해 왔습니다. BMW와의 협업, 다양한 대학 연구 등 실제 적용도 점차 늘어나고 있죠. 그리고 올해 2세대 제품을 선보였는데요. 이런 시스템이 중요한 이유는, 기존 AI가 사용하는 데이터에는 ‘시간’ 정보가 거의 빠져 있었다는 겁니다. 즉, 사람들의 실제 경험과 순간을 이해하는 데 한계가 있었는데요. Aria는 인간 시점의 생생한 데이터를 실시간으로 제공해, AR·로봇·유비쿼터스 컴퓨팅 등 미래 기술 발전의 새로운 가능성을 열고 있습니다. |
|
|
소수 언어 LLM은 어떻게 만들까? - 바스크어 사례
이제는 업무를 할 때나 공부를 할 때, 일상생활에서도 생성형 AI가 널리 사용되고 있습니다. OpenAI의 ChatGPT, 구글의 Gemini, DeepSeek의 DeepSeek 등이 대표적인데 우리나라 기업이 만든 생성형 AI는 아니지만 한국어 질문을 이해하고 답변하는 데에는 전혀 문제가 없습니다. 글을 쓴 다음에 어색한 부분이나 오타가 있는지를 교정하는 데에도 유용하게 활용되고 있습니다.
각종 언어 관련 통계를 제공하는 에스놀로그(Ethnologue)에 의하면 한국어를 쓰는 사람들은 약 8,000만 명으로 세계 17위를 기록했습니다.1) 한국어는 주요 언어 중 하나로 최근 우리나라 콘텐츠가 세계적인 인기를 끌면서 한국어를 배우는 사람들도 꾸준히 증가하고 있어 생성형 AI에서도 한국어 지원이 빠른 편입니다.
유네스코에서 2010년에 펴낸 ‘소멸 위기에 처한 세계 언어 지도’2) 에 따르면 전 세계에는 약 7,000여 개의 언어가 있으며, 이 중 3분의 1 이상이 소멸 위기에 처해있다고 합니다. 소수 언어를 하는 사람들은 더 많은 기회를 얻기 위해 다른 언어를 배울 수밖에 없으며, 시간이 지남에 따라 모국어 화자 수가 줄어들면서 마지막 화자가 사라지면 해당 언어 역시 소멸하게 됩니다.
LLM은 대규모 언어 데이터를 학습하여 사람이 하는 말을 이해하고 그에 맞는 답변을 생성합니다. 그러나 소수 언어의 경우 학습에 필요한 충분한 데이터를 확보하기 어렵고, 기업 입장에서도 시간과 비용, 효과를 고려할 때 소수 언어까지 지원하기는 쉽지 않습니다.
그렇다면 소수 언어 사용자들은 모국어로 생성형 AI를 사용할 수 없는 것일까요? 이 논문에서는 바스크어를 학습해 바스크어 LLM을 구축한 사례를 다루며, 소수 언어를 LLM에 학습시키는 방법을 구체적으로 제시하고 있습니다.3)
바스크어의 특징
경상도나 전라도, 제주도 등 지역에 사는 사람이 방언을 쓰면 다른 지역 사람은 같은 한국어라도 알아듣지 못하는 경우가 많습니다. 스페인은 스페인어를 쓰는 것으로 알고 있는데 우리가 스페인어라고 부르는 카스티야어를 가장 많이 사용하지만 바르셀로나가 속한 지역에서는 카탈루냐어, 포르투갈 북쪽에 있는 지역에서는 갈리시아어, 그리고 프랑스와의 국경에 있는 바스크 지역에서는 바스크어를 쓰는 등 여러 언어가 사용되고 있습니다.
바스크어(Basque Language - Euskara)는 어떤 언어 계통에도 속해있지 않은 고립어입니다. 섬은 지리적으로 육지와 떨어져 있기 때문에 언어가 독자적으로 발전할 수도 있지만 바스크 지역은 스페인과 프랑스에 걸쳐있어서 역사적으로 수많은 부침을 겪었는데 다른 어떤 언어와도 섞이지 않았고 언어의 기원도 알 수 없다는 점에서 특이합니다.
|
|
|
간단한 바스크어 문장을 알아보면 아래와 같습니다. |
|
|
< 표 1. 한국어 - 바스크어 - 스페인어 - 프랑스어 비교 > |
|
|
바스크어 LLM을 만드는 과정을 자세히 살펴보면 다음과 같습니다. |
|
|
1. 바스크어 기본 모델(BASEEU) 만들기
과거와는 달리 LLM이 점점 커지면서 매개변수도 많아졌고, 학습에 필요한 데이터셋도 대량으로 필요해졌습니다. 이에 따라 OpenAI, 구글, Meta와 같이 기초부터 LLM을 학습해 파운데이션(Foundation) 모델을 만드는 기업이 있는 반면, 이미 공개된 파운데이션 모델을 기반으로 적은 데이터로 미세조정(Finetuning)을 해서 원하는 목적에 맞게 활용하는 기업도 있습니다.
이번 논문에서 바스크어 LLM을 만들 때 메타에서 공개한 Llama 3.1 버전을 파운데이션 모델로 하여 바스크어 텍스트 데이터를 학습시켰습니다. 바스크어 텍스트 데이터로는 위키피디아, 뉴스, Common Crawl 등에서 수집한 약 430만 개의 문서(약 35억 개 토큰)를 이용하였습니다.
바스크어의 언어 코드는 EU이므로 이 논문에서는 기본 모델이나 데이터셋에 EU를 붙여 각각 BASEEU, INSTRUCTEU로 부르고 있습니다.
2. 바스크어 INSTRUCTION 데이터셋 만들기
LLM이 바스크어 텍스트 데이터를 학습했다고 해서 바스크어를 완전히 이해하는 것은 아닙니다. 단지 특정 단어가 주어졌을 때 다음에 나올 단어를 확률적으로 계산할 수 있을 뿐 사람이 입력하는 바스크어 질문을 이해하고 어떻게 답변해야 하는지 모릅니다. 이를 위해서 INSTRUCTION 데이터셋으로 학습하는 과정이 필요합니다.
바스크어 INSTRUCTION 데이터셋을 구축하는 작업은 쉽지 않습니다. 이번 논문에서는 먼저 영어 INSTRUCT 모델을 이용해 영어 INSTRUCTION 데이터셋을 생성하였고, 이후 첫 번째 단계에서 만든 바스크어 기본 모델(BASEEU)을 이용해 영어 INSTRUCTION 데이터셋을 바스크어로 번역하였습니다.
BASEEU 모델은 영어와 바스크어의 관계를 모르기 때문에 번역을 할 수 없지만 few-shot 방식으로 영어와 바스크어 변역 예시를 프롬프트에 주면 영어와 바스크어의 관계를 이해할 수 있기 때문에 번역이 가능해집니다. Few-shot 방식이어서 번역이 잘되지 않는 경우도 있는데 바스크어 번역 결과를 보고 특정 단어가 반복되거나 하는 등의 오류를 걸러내는 작업을 하였고, 이를 통해 바스크어 INSTRUCTION 데이터셋의 품질을 높였습니다.
|
|
|
< 그림 3. 영어 INSTRUCTION 데이터셋을 바스크어로 번역한 예시 > |
|
|
3. 바스크어 기본 모델 학습하기
바스크어 텍스트 데이터셋을 학습해서 만든 바스크어 기본 모델(BASEEU)에 영어 INSTRUCTION 데이터셋을 바스크어로 번역한 바스크어 INSTRUCTION 데이터셋으로 학습을 해서 바스크어 INSTRUCTEU 모델을 만듭니다.
바스크어 기본 모델(BASEEU)이 바스크어에 대한 기본 지식을 쌓았다면, INSTRUCTEU 모델에서는 이를 한 단계 발전시켜 사람이 하는 바스크어 문장을 이해하고, 이에 대한 적절한 답을 바스크어로 생성할 수 있게 합니다.
4. 바스크어 LLM 평가하기
이렇게 해서 만들어진 바스크어 LLM의 성능은 어떨까요? 바스크어 LLM인 만큼 평가를 할 때에도 바스크어 데이터셋을 이용해야 하는데 주요 데이터셋은 아래와 같습니다.
- EusReading: 바스크어 C1 수준 시험에서 추출한 350여 개의 독해문제 데이터셋
- EusProficiency: 바스크어 공식 시험에서 추출한 5,000개 질문 및 답변 데이터셋
- BertaQA: 바스크 지역과 문화 등에 대한 데이터셋
- BasqBBQ: 편향성 검증을 위한 데이터셋을 바스크어에 맞춰 조정한 데이터셋 |
|
|
미국 법원이 AI 기업 앤스로픽의 AI 훈련 과정에서 저작권자의 동의 없이 책을 학습한 행위에 대해 ‘공정 이용’에 해당한다고 판결했습니다. 생성형 AI가 생성한 결과물이 변형적이고 창의적인 방식으로 활용된다는 점에서 저작권 침해로 보기 어렵다는 판단을 내린 건데요. 이번 판결은 AI 훈련 데이터와 저작권 분쟁에 대한 미국 내 첫 사법적 판단으로, 향후 생성형 AI 개발과 데이터 활용 기준에 큰 영향을 미칠 전망입니다. 특히 AI가 콘텐츠를 학습하는 과정 자체는 공정 이용으로 인정하면서도, 불법적으로 수집된 파일을 이용한 경우에는 법적 책임을 묻는 이원적 접근 방식이 특징입니다.
생성형 AI 악성댓글 "꼼짝마"...98.5% 탐지 기술 개발
국가보안연구소와 KAIST 연구팀이 AI가 생성한 한국어 댓글을 98.5% 정확도로 탐지할 수 있는 플랫폼 ‘엑스댁(XDAC)’을 개발했습니다. 이 플랫폼은 AI와 인간 댓글 간의 말투와 형식 차이를 정밀 분석하며, 댓글을 생성한 언어모델의 종류까지 식별할 수 있는 것이 특징입니다. 엑스댁은 짧고 비문이 많으며 구어체가 주를 이루는 한국어 댓글 환경의 특수성을 고려해 설계되었으며, 기존 AI 탐지 기술의 한계를 극복한 세계 최초의 사례로 평가받고 있습니다. 이번 기술은 AI를 활용한 댓글 조작, 여론 왜곡, 허위정보 유포 방지에 실질적인 기여를 할 수 있을 것으로 기대를 모으고 있습니다.
오픈AI와 앤트로픽은 최근 자사의 대형언어모델(LLM)에서 인간을 해치거나 비윤리적 결정을 내리는 ‘오정렬(Misalignment)’ 사례가 다수 확인되었다고 밝혔습니다. AI가 설정된 목표를 달성하기 위해 인간의 지시를 거부하거나, 의도와 상반된 방식으로 행동하는 상황이 발견되면서 내부자 위협과 유사하다는 우려가 제기되고 있는데요. 실험 결과, 극한 조건에서 AI는 협박, 기밀 유출, 구조 요청 취소 등 전략적으로 유해한 선택을 자율적으로 수행하기도 했습니다. 이는 단순한 오류가 아닌, 목표 중심의 합리적 판단 과정에서 발생한 결과로 분석되며, AI가 인간과의 가치 충돌 상황에서 위험한 행동을 택할 수 있음을 시사합니다.
|
|
|
인공지능(AI) 언어 데이터 전문 기업 플리토는 AI 반도체 설계 기업 퓨리오사AI와 AI 기술 공동 연구를 위한 업무협약(MOU)을 체결했습니다. 이번 협약은 양사가 보유한 데이터와 반도체 기술을 접목해 차세대 AI 언어 서비스의 성능을 고도화하기 위한 협력의 일환입니다. 양사는 고품질 AI 언어 데이터셋 구축, 음성인식(STT), 기계번역(MT), 음성합성(TTS) 등 핵심 모델 알고리즘의 공동 개발을 추진하며, NPU 기반 실시간 동시통역 및 이미지 자동 번역 기술도 함께 연구할 예정입니다. 플리토는 이번 협력을 통해 자사가 보유한 실사용 기반 언어 데이터와 통번역 솔루션을 퓨리오사AI의 고성능·저전력 AI 반도체 플랫폼에 결합하여, 글로벌 시장에서 경쟁력 있는 통합형 AI 언어 서비스를 선보일 수 있도록 기술 고도화에 박차를 가하겠습니다.
|
|
|
스터닝밸류리서치는 플리토를 AI 기반 언어모델 분야의 국내 최강 기업으로 평가하며, 이재명 정부가 추진하는 AI 육성 정책의 수혜가 기대된다고 밝혔습니다. 특히 ‘AI 세계 3대 강국 도약’을 목표로 정부 예산과 민간 투자가 확대되는 정책 기조 속에서 플리토의 성장 가능성에 대한 기대감이 높아지고 있습니다. 플리토는 자체 플랫폼인 Arcade를 통해 다국어 병렬 말뭉치를 수집, 정제, 검수하고 있으며, 이를 바탕으로 언어 데이터 판매와 번역 서비스를 제공하고 있습니다. 2023년 말에는 실시간 통번역 솔루션 ‘Chat Translation’과 컨퍼런스 전용 ‘Live Translation’을 출시해, LG전자, 하나금융, 국제 포럼 등 다양한 고객사를 확보하며 최근 3년간 연평균 29.5%의 매출 성장률을 기록했습니다. 스터닝밸류리서치는 플리토가 올해 흑자 전환에 성공할 것으로 전망하며, 전방위적인 AI 언어 사업에서 높은 경쟁력을 갖추고 있다고 분석했습니다.
|
|
|
플리토와 퓨리오사AI는 지난 7월 1일, AI 기술 공동 연구를 위한 양해각서를 체결했습니다. 이번 협약은 클라우드 기반 GPU에 의존하던 플리토의 일부 AI 서비스를 퓨리오사AI의 AI 반도체 RNGD로 전환하기 위한 기반을 마련하는 것으로, 향후 저전력·고성능 통번역 솔루션으로의 확장을 목표로 하고 있습니다. 퓨리오사AI는 플리토가 구축한 고품질 데이터를 바탕으로 자사 NPU에 적합한 언어 모델 연산 환경을 테스트하고 최적화할 수 있으며, 플리토는 음성 인식(STT), 기계 번역(MT), 음성 합성(TTS) 등 실시간 멀티모달 AI 처리에 RNGD를 적용해 제품화를 추진할 계획입니다. 플리토는 올해 3월과 7월, 글로벌 빅테크 기업들과 각각 113억 원, 64억 원 규모의 언어 데이터 공급 계약을 체결하며, 총 177억 원의 수주 실적을 달성했습니다. 이번 협력은 고품질 언어 데이터를 국산 AI 반도체에 적용하는 국내 첫 사례 중 하나로 평가받고 있습니다. |
|
|
Beyond Language Barriers!
|
|
|
플리토 (Fliitto Inc.)
서울 강남구 영동대로96길 20 대화빌딩 6층
|
|
|
|
|