☕️ Café de Flitto - 9월호 플리토-트위그팜, AI 번역기 품질 평가 데이터 구축... 초거대 AI 환경 조성 기대
플리토가 트위그팜, 시스트란, 글나무 등 5개 기업과 인공지능(AI) 번역기 품질 평가를 위한 데이터를 공동 구축합니다.
지금까지 정부 주도의 대규모 말뭉치 데이터 구축이 지속되어 왔지만, 정작 '데이터 품질 평가' 기술에는 한계가 있었습니다.
이번 사업은 초고품질 다국어 데이터 구축 및 품질 평가를 통해 초거대 AI 환경 조성에 기여할 것으로 보이며, 플리토의 통합 플랫폼은 고품질 다국어 데이터 구축에 큰 역할을 할 것으로 기대됩니다. |
|
|
플리토, 국제방송영상마켓 참가... 다국어 현지화 툴 공개
플리토 로컬라이제이션 사업부는 지난달 16일부터 18일까지 서울 코엑스에서 열린 '2023 국제방송영상마켓(BCWW)'에 참가했습니다.
아시아 최대 규모인 이번 행사에 플리토는 '미디어 테크놀로지' 부문으로 참가하여, 플리토 전문번역 서비스의 품질 경쟁력과 기업 고객용 번역 관리 플랫폼 '플리토 엔터프라이즈' 최신 버전의 시연을 선보여 업계 관계자들의 많은 관심을 받았습니다. |
|
|
플리토, 신세계백화점 본점에 디지털 메뉴 번역 제공
플리토가 신세계백화점에 입점한 총 54개 외식 브랜드에 디지털 다국어 메뉴 번역 서비스를 제공합니다.
신세계백화점 본점 내 다양한 문화권의 외식 브랜드 메뉴를 영어, 중국어 간체, 중국어 번체, 일본어, 인도네시아어, 태국어, 베트남어, 말레이어 총 8개 언어로 번역해 서비스합니다.
플리토 메뉴 번역 서비스는 최근 생성형 AI를 결합해 각 메뉴에 대한 상세 설명까지 확인할 수 있게 되었습니다. 국내 최초 유일한 방식으로, 번역의 정확도, 사용 편의성, 경제성 등을 높이 평가받아 전통시장에서 미슐랭 맛집, 프리미엄 쇼핑몰까지 다양한 매장으로 도입이 확대되고 있습니다. |
|
|
Flitto Localization
BCWW 2023 플리토 참가 현장 스케치
올해 국제방송영상마켓(BCWW)의 주제는 '콘텐츠의 새로운 미래를 펼치다'로, 전 세계 35개국이 참가하여 성황리에 마무리 되었습니다.
CJ ENM, 지상파방송 3사 등 국내 주요 콘텐츠 제공 사업자들이 앞다투어 참가해 글로벌 사업자들과 활발한 바이어 미팅을 이어갔는데요.
플리토는 알차게 준비한 홍보 부스를 통해 전문 번역 및 현지화 서비스를 소개했으며, 특히 기업용 번역 관리 플랫폼 '플리토 엔터프라이즈'의 최신 버전 데모를 시연해 많은 방문객의 이목을 끌었습니다.
BCWW 2023에 참가한 기업들의 이모저모를 플리토 블로그에서 확인해보세요. |
Flitto Event
'올댓트래블 2023'에서 소개된 플리토 플레이스
트래블테크 분야 대표 전시회인 '올댓트래블 2023'는 올해 '기술이 여행에 미치는 영향과 미래의 방향'이라는 주제로 개최되었습니다.
플리토 이정수 대표는 <ChatGPT를 활용한 여행 정보 제공의 발전>을 주제로, 외국인 관광객에게 플랫폼 기반의 다국어 서비스를 제공할 때 주요한 점, 그리고 서비스 운영 과정에서 생성된 데이터를 재료로 더 정확하고 자연스러운 결과를 만드는 방식에 대해 소개했습니다.
플리토 플레이스는 트래블테크의 핵심이 데이터에 있다는 점을 강조하는데요. 더 자세한 내용은 블로그에서 확인할 수 있습니다.
|
|
|
Flitto DataLab [EN]
자연어처리(NLP) 기술은 비약적인 발전을 이뤄나가고 있습니다. 최신 NLP 기술을 장착한 챗봇을 비롯해, 최근 발표되는 응용 기술은 마치 사람과 이야기하는 듯한 경험을 제공합니다.
그러나 무작위로 수집된 학습용 데이터에는 한계가 있으며, 아직 NLP는 발전 여지가 많은 부분입니다. 기술 보완에는 사람의 개입이 필요하지만, 사람 작업자에 따라 '비꼼(sarcasm)', '교묘한 조종(manipulation)' 등의 의도를 파악하는 정도가 각기 다르므로 여전히 한계가 존재합니다.
이런 점을 포함해, 오늘날 자연어처리 기술의 발전에 중요한 척도에는 어떤 것들이 있는지 플리토 데이터랩의 영문 블로그를 통해 확인하실 수 있습니다. |
Flitto DataLab [EN]
아랍어 문자 인식(OCR) 기술의 현황
아랍어는 세계에서 네 번째로 많이 사용되는 언어입니다. 새로 배우려면 10년 이상을 잡아야 한다는 말이 있을 정도로 고난도의 언어인데요. 그만큼 광학문자인식(OCR) 기술의 효용성이 높은 언어이기도 합니다.
아랍어는 OCR 엔진의 학습 역시 어려운 언어입니다. 지역마다 사용하는 문자 시스템이 다르고, 점 하나로 의미가 달라지는 경우도 많습니다. 아랍어는 현존하는 데이터보다 훨씬 많은 양의 학습을 필요로 합니다.
플리토 데이터랩의 영문 블로그를 통해 아랍어 OCR 학습 데이터에 대해 더 자세히 알아보세요.
|
|
|
#인공지능 #챗GPT #언어데이터 #챗봇 #다국어번역 |
|
|
|