
개발 기능
사용 된 엔드 투 엔드 딥 러닝 방법은 다국어 지원을위한 고정밀 프라그 마틱 슬롯 인식을 가능하게합니다
- 입력/출력 샘플 만 사용하여 배울 수있는 엔드 투 엔드 딥 러닝 방법*4를 채택함으로써 언어 별 전문 지식없이 연설의 언어와 내용을 동시에 인식하는 데 성공했습니다.
- 엔드 투 엔드 딥 러닝 방법이있는 고유 한 "하이브리드 CTC/주의 방법"*5그리고 동시 다국어 학습은 프라그 마틱 슬롯 인식 정확도를 향상시킵니다
- 사전 언어 설정없이 원활한 다국어 프라그 마틱 슬롯 인식 달성
- 여러 스피커가 동시에 말하고 오디오 중첩이있는 상황에 대한 추가 응답
- *4
하나의 큰 신경망으로 입력에서 출력까지 다양한 프로세스를 수행하는 여러 모듈을 대체하는 교육
- *5
프라그 마틱 슬롯 간격과 문자열 사이의 시간적 대응을 정확하게 추정하는 두 가지 전형적인 기존 방법, CTC
(COnnectionisttEmporalClassification)의 장점을 결합한 고유 한 방법.
개발 개요
5 개 언어 (일본어, 영어, 프랑스어, 독일어, 이탈리아어) | 10 개 언어 | |
---|---|---|
이번에는 (사전 언어 설정 없음) | 90% 이상 | 80% 이상 |
정기적 인 (사전 언어 설정 이용 가능)*6 | 87% | 72% |
- *6
각 언어에 대한 프라그 마틱 슬롯 인식 시스템을 구축하고 배우고, 말해야 할 언어를 미리 알고
미래 개발
우리는 자동차 나 시설 가이드 내 대화와 같은 다양한 상황에서 말하는 언어를 알지 못하고 자유롭게 말할 수있는 편리한 프라그 마틱 슬롯 인터페이스를 만들기 위해 계속 발전 할 것입니다.
개발 연구소
Mitsubishi Electric Research Laboratories
201 Broadway, 8 층, 케임브리지, MA 02139-1955 U.S. A
팩스 +1-617-621-7550
http : //www.merl.com/
Mitsubishi Electric Co., Ltd. 정보 기술 연구소
1-1 OFUNA 5-HOME, 카마 가라 시사, 경. 247-8501
팩스 0467-41-2142
http : //www.mitsubishielectric.co.jp/corporate/randd/inquiry/index_it.html