2026년 4월 4주차 - Flitto AI Picks 2026년 4월 4주차 Flitto AI Picks |
|
|
|
안녕하세요. 햇살이 한층 부드러워진 요즘입니다.
가벼워진 옷차림처럼, 핵심만 간결하게 담았습니다.
☑️ 직종에 맞는 AI가 있다고? 퍼스널 AI시대의 도래👐
☑️ 미토스 쇼크: 보안의 기준을 다시 쓰다🔒
☑️ 쿼카쌤이 알려주는 AI 용어 #7
☑️ LLM을 이용한 안전성(Safety) 탐지, 성능을 어떻게 더 높일까?
|
|
|
잠시만요!
오늘은 여러분들과 더 소통하기 위한 설문조사를 마련했어요.
설문 참여자 중 추첨을 통해서 선정된 분들께
35,000원 상당의 플리토 AI 통번역 애플리케이션
'챗 트랜스레이션(Chat Translation)' 무료 이용권을 드립니다!
단 1분밖에 걸리지 않으니, 꼭 참여해 보세요🎁 |
|
|
직종에 맞는 AI가 있다고? 퍼스널 AI 시대의 도래👐 |
|
|
인공지능은 이제 단순한 대화 상대를 넘어 스스로 업무를 수행하는 '에이전트' 시대로 진화했습니다. 2026년 1분기에만 무려 255개의 신규 모델이 쏟아져 나오면서, AI 선택 기준이 가장 뛰어난 모델에서 내 업무에 가장 적합한 모델로 변화했습니다. 실제로 현장 전문가들의 사용 현황을 살펴보면, 마치 전공 분야가 나뉘듯 직종별로 선호하는 AI가 확연히 다르다는 점이 흥미롭습니다. 직종별로 선호하는 생성형 AI를 소개해 드리겠습니다.
|
|
|
먼저 개발자들 사이에서는 "코딩은 역시 클로드"라는 공식이 통하고 있습니다. 실제 설문 조사에서 개발자의 70%가 클로드를 압도적으로 선호했습니다. 기능적 코딩 정확도 또한 95%에 달해 챗GPT를 앞섰기 때문입니다. 특히 클로드는 수만 줄의 코드를 한꺼번에 읽어내는 거대한 '컨텍스트 윈도우'를 자랑해, 복잡한 디버깅이나 멀티 파일 프로젝트를 진행할 때 개발자의 든든한 파트너 역할을 톡톡히 해내고 있습니다.
|
|
|
그렇다면 재무 담당자들은 어떨까요? 이들은 사소한 데이터의 오류도 용납하지 않는 분석력과 거버넌스 구축 역량이 중요합니다. 그렇기에 실무에서는 "숫자 검증은 클로드, 보고서 초안은 챗GPT"라는 전략적인 조합을 사용합니다. 수치 계산이나 정밀한 재무 모델링 작업에서는 클로드의 탁월한 분석력을 신뢰합니다. 하지만 이를 문서화하거나 창의적인 아이디어를 보탤 때는 범용 성능이 뛰어난 챗GPT를 병행하는 식이죠.
마케팅과 기획, 콘텐츠 제작 직군에서는 여전히 챗GPT가 '올라운더'로서 사랑받고 있습니다. 챗GPT는 글쓰기, 시장 조사, 스토리텔링 분야에서 인간보다 창의적이라는 평가를 받을 만큼 다양한 아이디어를 빠르게 제안합니다. 특히 이미지 생성이나 웹 검색 같은 부가 기능이 강력해 범용성이 매우 높기 때문입니다. 결국 중요한 것은 기술의 절대적 성능이 아니라, 나의 업무 결에 맞춰 어떤 도구를 쥐느냐에 달려 있습니다. 오늘 당신의 업무에 딱 맞는 '퍼스널 AI'와 함께 퇴근 시간을 앞당겨 보시는 건 어떨까요?
|
|
|
요즘 AI 업계에서 '미토스 쇼크'라는 말이 나올 정도로 앤트로픽이 공개한 '미토스(Mythos)'가 화제입니다. 클로드로 존재감을 키워온 앤트로픽은 이번 모델을 "가장 강력한 AI"로 평가하면서도, 일부 기업에만 제한적으로 공개하는 전략을 택했습니다. 코드 생성은 물론 운영체제(OS)와 웹 브라우저의 보안 취약점을 탐지하고 분석하는 능력까지 갖추게 됐습니다. 특히 오픈BSD에서 27년간 발견되지 않았던 결함을 찾아낸 사례까지 나오면서, 이는 사이버 보안 영역에서 새로운 기준을 제시하고 있다는 평가를 받고 있습니다.
미토스의 가장 큰 특징은 취약점을 찾는 데 그치지 않는다는 점입니다. 여러 취약점을 연결해 실제 공격이 가능한 시나리오와 익스플로잇 코드까지 생성할 수 있습니다. 기존 AI가 문제 발견에 가까웠다면, 미토스는 문제 활용 단계까지 확장된 셈입니다. 실제로 오랜 기간 발견되지 않았던 소프트웨어 결함을 찾아내며, 인간 전문가 수준을 뛰어넘는 성능도 보여줬습니다. 이 때문에 미토스는 방어와 공격 모두에 활용될 수 있는 '양날의 검' 같은 AI로 평가됩니다.
|
|
|
이처럼 강력한 성능은 곧바로 우려로 이어집니다. 앤트로픽은 해커나 범죄 집단의 악용 가능성을 이유로 '프로젝트 글래스윙'을 통해 일부 빅테크, 금융, 보안 기업에만 미토스를 제한적으로 제공하고 있습니다. 방어 측이 먼저 대응할 시간을 확보하겠다는 의도입니다. 동시에 미국 정부와 금융당국까지 나서 AI 기반 사이버 공격 가능성을 점검하는 등, 이 기술이 기업 이슈를 넘어 중요한 리스크로 인식되고 있습니다. 다만 성능 검증 정보가 충분히 공개되지 않았다는 점에서 신중하게 볼 필요도 있다는 의견이 나옵니다.
미토스는 '창과 방패를 모두 쥔 지능을 누가 통제할 것인가'라는 묵직한 질문을 던집니다. AI가 해킹의 시간을 수개월에서 수초로 단축했습니다. 제대로 대비하지 않으면 디지털 영토는 그야말로 무법지대가 될 수밖에 없습니다. 미 행정부와 연준까지 나서서 빅테크 수장들과 긴급회의를 소집한 것은 이제 사이버 보안이 기술의 영역을 넘어 국가 안보와 직결된 실존적 위협이 되었음을 시사합니다. 결국 AI를 안전하게 활용하고 통제하는 역량이 더욱 중요해질 것입니다.
|
|
|
쿼카 쌤이 알려주는 AI Tech 용어 #7 👩🏫
안녕하세요, 쿼카 쌤입니다.🐨
오늘도 궁금해하실 만한 용어들을 준비했습니다.
오늘은 또 어떤 단어일지, 바로 확인해 볼까요?🔤
|
|
|
⚙️ Parameter (파라미터)
: AI 모델 내부에서 학습되는 수많은 가중치 값을 의미해요. 이 값들이 어떻게 조정되느냐에 따라 모델의 성능과 결과가 달라지죠. AI의 '지능'을 구성하는 가장 기본적인 요소랍니다.
✅ 포인트
- 모델의 크기와 성능을 결정하는 핵심 요소
- 학습 과정에서 지속적으로 업데이트
- 수십억~수천억 개 규모로 확장되는 추세
|
|
|
⚪ Token (토큰)
: AI가 텍스트를 이해하고 처리할 때 사용하는 기본 단위예요. 문장을 그대로 보는 게 아니라, 단어 및 문장 일부를 잘게 나눠서 인식하는 방식이죠. AI가 언어를 계산할 수 있게 만드는 최소 단위입니다.
✅ 포인트
- 텍스트를 분해해 처리하는 단위
- 요금·성능·속도와 직접적으로 연결
- LLM 동작 방식 이해의 핵심 개념
|
|
|
🎯 Fine-tuning (파인튜닝)
: 이미 학습된 모델을 가져와 특정 목적이나 데이터에 맞게 추가로 학습시키는 과정이에요. 처음부터 모델을 새로 만드는 게 아니라, 기존 모델을 기반으로 원하는 방향으로 성능을 조정하는 방식이죠. 범용 AI를 맞춤형 AI로 바꾸는 단계라고 볼 수 있어요.
✅ 포인트
- 기존 모델을 활용해 효율적으로 성능 개선
- 도메일 특화·기업 맞춤형 AI 구현
- 학습 비용과 시간 절감
|
|
|
LLM을 이용한 안전성(Safety) 탐지, 성능을 어떻게 더 높일까?
|
|
|
챗GPT가 등장한 이후 사람들의 검색 습관도 빠르게 바뀌고 있습니다. 예전에는 구글이나 네이버와 같은 검색엔진에 키워드를 입력한 뒤 검색 결과로 나오는 여러 문서들을 하나씩 클릭하면서 원하는 정보를 찾을 때까지 확인하는 과정이 반복되었습니다. 하지만 최근에는 검색 자체를 챗GPT와 같은 AI에게 직접 물어보는 경우가 늘고 있습니다. 기존 검색 엔진은 사용자가 스스로 정보를 선별해야 했지만 챗GPT는 자신이 학습한 데이터나 외부 문서들을 검색해서 정보를 찾은 후 사용자에게 최적화된 형태로 편집해 제공하기 때문에 편리합니다.
챗GPT는 2022년 말에 등장한 이후 사용자가 폭발적으로 늘어났는데 온라인에 있는 데이터를 모아서 학습하였기 때문에 마약이나 폭탄을 만드는 방법을 물어보면 친절하게(?) 알려주었고, 인종차별이나 성차별 등에 대한 표현도 여과 없이 보여주었습니다. 이후 이러한 사례들이 문제가 되면서 LLM이 어떤 질문에 답변하지 않아야 하는지 안전성(Safety)에 대한 연구도 활발히 진행되었습니다. 이제는 대부분의 LLM이 불법적인 내용뿐만 아니라 윤리나 도덕적으로 문제가 되는 질문에 대해서도 답변을 거부합니다.
|
|
|
안전성 탐지가 어려운 유형
사람이 하는 말 중에서는 문장 자체만 놓고 보면 욕설이나 금지어가 없어서 문제가 안 되지만 사회 및 문화적 맥락 등을 고려하면 상황에 따라 언어 폭력이 될 수도 있습니다. 이러한 내용들을 몇 가지 유형으로 나눠서 정리해 보면 아래와 같습니다.
|
|
|
안전성 탐지의 정확도를 높이기 위한 방법
1. 정답 외에 판단 근거까지 제시한 CoT(Chain-of-Thought) 데이터셋 구축 및 학습
챗GPT가 처음 나왔을 때 사람들은 챗GPT의 언어 능력에 놀랐지만, 동시에 수학 능력에 대해서도 적지 않은 충격을 받았습니다. 바로 간단한 사칙연산도 틀리는 경우가 많았기 때문입니다. 청산유수처럼 말을 잘하는 것과 비교했을 때, 어떻게 이렇게 간단한 문제도 풀지 못할까 하는 의문이 들기도 했습니다. 이후 챗GPT의 문제 풀이 능력은 급격히 향상되어서 이제는 국제수학올림피아드(IMO) 문제를 풀도록 했을 때 금메달을 딸 수준에 이르렀습니다. 이렇게 될 수 있었던 배경에는 어떤 과정을 거쳐서 답이 도출되는지를 단순히 단답형 정답 뿐만 아니라 풀이 과정을 단계적으로 설명한 CoT 데이터셋이 등장하였기 때문입니다.
이는 안전성을 탐지하는 데이터셋을 만들 때도 그대로 적용될 수 있는데 과거 이분법 데이터셋처럼 이 문장은 혐오 표현이다/아니다라고만 하는 것이 아니라 그 이유까지 상세히 설명해 주는 식으로 CoT 데이터셋을 설계할 수 있습니다.
|
|
|
수학 CoT 데이터셋을 통해 LLM이 단계적으로 어떻게 문제를 풀어야 하는지 알 수 있게 된 것처럼 안전성 CoT 데이터셋도 문화를 반영하고 문맥을 고려하도록 관련된 정보를 추가함으로써 더 정확하게 안전성을 탐지할 수 있습니다.
2. 텍스트 외에 이미지/오디오 등 멀티모달로 확장
이미지나 음성 등은 맥락에 따라서 전혀 문제가 되지 않을 수도 있으며, 표현을 어떻게 하는가에 따라서 혐오 표현으로 분류되어 문제가 될 수도 있습니다.
|
|
|
특정 국가의 사람들이나 인종을 비꼬기 위해 동물로 표현하는 경우가 있는데 동물 사진 자체만으로는 문제가 없지만 텍스트와 결합하는 경우 혐오 표현이 될 수 있습니다. 음성 역시 말하는 사람의 억양이나 음의 높이에 따라 칭찬이 되기도 하고 비난하는 게 되기도 합니다. 이런 경우도 텍스트만 본다면 LLM은 아무런 문제가 없다고 판단할 수 있습니다.
따라서 텍스트뿐만 아니라 이미지, 음성 등이 서로 어떻게 연관되는지 멀티모달 데이터셋을 구축해 학습함으로써 LLM이 맥락을 고려해 정확한 판단을 내릴 수 있도록 할 수 있습니다.
3. 인간 전문가의 실시간 개입 (Human-in-the-loop 방식의 동적 지식베이스)
LLM의 학습에는 한계가 있기 때문에 아무리 안전성 강화에 필요한 데이터셋을 구축해 학습하더라도 어딘가에는 빈틈이 존재할 수밖에 없습니다. 이러한 경우 인간 전문가가 실시간으로 개입을 할 수 있도록 지식베이스(Knowledge Base) 기반의 참조 데이터베이스를 구축하는 것도 방법이 됩니다.
특정 커뮤니티에서 새롭게 쓰이기 시작한 은어가 혐오 표현으로 사용되는 경우 이를 탐지하기 위한 LLM을 만들기 위해서는 해당 은어가 포함된 문장을 수집 및 라벨링 하여 데이터셋으로 만든 뒤 LLM을 재학습시켜야 합니다. 이 과정에서 많은 시간과 자원이 필요하기 때문에 대응이 늦어질 수 있습니다. 지식베이스를 만들어 놓는다면 인간 전문가가 이 정보를 지식베이스에 업데이트하는 것만으로도 정확도를 높일 수 있습니다.
정리
LLM의 성능이 향상되면서 다양한 분야에서 활용되고 있습니다. 과거에는 번역이나 요약, 키워드 추출 등 일부 작업에 제한적으로 활용되었다면, 최근에는 누구나 쉽게 원하는 작업을 프롬프트로 작성해서 지시할 수 있게 되면서 LLM의 활용 범위가 무궁무진해졌습니다.
이와 함께 LLM의 안전성도 중요한 요소로 부각되고 있습니다. 현재 수준보다 더욱 정교하고 정확한 판단을 구현하기 위해서는 이에 부합하는 데이터셋 구축과 학습, 그리고 체계적인 평가가 필수적입니다.
플리토는 LLM의 사전·사후 훈련 데이터셋은 물론 위에서 언급한 안전성 강화를 위한 특수 목적 데이터셋까지 고객사의 요구에 맞게 구축하고 있습니다. 이를 통해 보다 높은 신뢰도를 갖춘 LLM 개발에 기여하겠습니다.
|
|
|
메타가 초지능 연구팀을 통해 첫 AI 모델 '뮤즈 스파크'를 공개하며 경쟁력 강화에 나섰습니다. 해당 모델은 알렉산더 왕이 이끄는 메타초지능연구소(MSL)에서 개발된 결과물입니다. 작고 빠른 구조를 갖추면서도 과학·수학 등 복잡한 문제에 대한 추론 능력을 확보한 것이 특징입니다. 벤치마크에서는 오픈AI, 구글, 앤트로픽의 주요 모델들과 유사하거나 일부 항목에서 앞서는 성능을 기록했습니다. 특히 여러 에이전트가 동시에 추론하는 '심사숙고 모드'를 통해 고난도 문제 해결 능력을 강화했습니다. 안전성 측면에서도 위험 요청을 거절하는 비율이 경쟁 모델 대비 높은 수준을 보였습니다. 기존 '라마'와 달리 폐쇄형 모델로 출시됐으며, 향후 개방형 전환 가능성도 열어둔 상태입니다. 메타는 이를 자사 SNS와 AI 디바이스 전반에 적용하며 AI 플랫폼 경쟁 주도권 확보를 노리고 있습니다.
|
|
|
앤트로픽의 AI 모델 '클로드'가 국내 생성형 AI 앱 시장에서 빠르게 점유율을 확대하고 있습니다. 클로드는 올해 초 10위권에서 지난 3월 신규 설치 기준 3위까지 올라서며 단기간에 톱3에 진입했습니다. 설치 건수는 3개월 만에 약 8.5배 증가했으며, 전년 동기 대비로도 10배 이상 성장했습니다. 월간 활성 이용자 수(MAU) 역시 60만 명을 넘기며 처음으로 상위 5위권에 진입했습니다. 다만 시장 1위는 여전히 오픈AI의 챗GPT가 유지하고 있으며, 구글 제미나이도 설치 수 기준 2위를 기록했습니다. 클로드의 성장 배경으로는 정확성과 안정성 중심의 응답 구조, 개발자·전문직 수요 확대가 꼽힙니다. 특히 공공·국방 분야 활용 사례가 알려지며 신뢰도가 상승한 점도 사용자 유입에 영향을 준 것으로 분석됩니다. 업계에서는 생성형 AI 시장이 속도 경쟁에서 신뢰·전문성 중심으로 재편되는 흐름 속에 클로드의 상승세를 주목하고 있습니다.
|
|
|
구글이 오픈 모델 '젬마 4'를 공개하며 AI 생태계 확장에 나섰습니다. 젬마 4는 '제미나이 3' 기반 기술을 공유하면서도, 개발자가 자체 하드웨어에서 실행할 수 있는 개방형 모델이라는 점이 특징입니다. 특히 고급 추론과 에이전트 기반 워크플로우에 최적화된 성능을 갖춰 자율형 AI 개발을 지원합니다. 모델은 2B부터 31B까지 네 가지 크기로 제공되며, 용도에 따라 속도와 성능을 선택할 수 있습니다. 또한 최대 256K 컨텍스트를 지원해 긴 문서나 코드 분석 등 복잡한 작업 처리 능력을 강화했습니다. 140개 이상의 언어와 이미지·영상 등 멀티모달 기능을 기본 탑재해 글로벌 서비스 개발에도 유리합니다. 아파치 2.0 라이선스로 배포돼 개발자 자율성과 생태계 확장성을 높였다는 점도 특징입니다. 구글은 이를 통해 '에이전트 시대'를 겨냥한 개방형 AI 플랫폼 주도권 확보에 나섰습니다.
|
|
|
플리토가 '시스코 커넥트 2026 코리아'에 참가해 AI 통번역 솔루션의 실사용 사례를 공개했습니다. 플리토는 파트너사로서 공동 부스를 운영하며 웹엑스 전용 B2C 솔루션 '챗 트랜스레이션'을 선보였습니다. 현장에서는 영어, 중국어, 베트남어 등 다양한 언어로 실시간 번역 체험을 제공하며 실제 업무 환경 적용 가능성을 강조했습니다. 참가자들은 최대 34개 언어를 지원하는 번역 품질과 속도를 직접 확인했습니다. 또한 메인 키노트 및 부대 행사에 B2B 솔루션 '라이브 트랜스레이션'을 제공해 발표 내용을 실시간으로 번역했습니다. QR코드를 통해 개인 디바이스에서 최대 43개 언어 번역 결과를 확인할 수 있는 환경도 구현했습니다. 이번 사례는 AI 통번역 기술이 실제 비즈니스 커뮤니케이션에서 안정적으로 작동함을 보여준 사례로 평가됩니다. 플리토는 이를 기반으로 글로벌 협업 환경에서의 언어 장벽 해소를 지속 확대해 나갈 계획입니다.
|
|
|
플리토, 국립국어원 '한국어-외국어 말뭉치 구축 사업' 수주 |
|
|
플리토가 국립국어원 '2026년 한국어-외국어 말뭉치 구축 사업' 수행 기업으로 선정되며 데이터 사업을 확대했습니다. 해당 사업은 AI 시대 언어 데이터 주권 확보와 통번역·음성인식 기술 고도화를 위한 국가 핵심 프로젝트입니다. 플리토는 수행 업체로 참여해 총 595만 어절 규모의 병렬 말뭉치 구축을 담당합니다. 기존 9개 언어에 아랍어를 추가해 총 10개 언어 데이터 구축을 진행합니다. 올해는 문장 단위에서 문단 단위로 확장하고 음성 기반(STS) 데이터까지 포함해 활용도를 높입니다. 데이터 정제, 평가 기준, 번역 플랫폼 개선 등 품질 관리 체계 고도화도 병행됩니다. 플리토는 이번 사업을 포함해 누적 약 6100만 어절 이상의 데이터 구축 실적을 확보하게 됐습니다. 이를 통해 저자원 언어 데이터 격차를 해소하고 차세대 AI 번역 모델 개발에 기여할 것으로 기대됩니다.
|
|
|
플리토 (Fliitto Inc.)
서울 강남구 영동대로96길 20 대화빌딩 6층
|
|
|
|
|