CLOVA Speech 개요
- 인쇄
- PDF
CLOVA Speech 개요
- 인쇄
- PDF
기사 요약
이 요약이 도움이 되었나요?
의견을 보내 주셔서 감사합니다.
Classic/VPC 환경에서 이용 가능합니다.
CLOVA Speech는 CLOVA의 NEST(Neural End-to-end Speech Transcriber) 음성 인식 기술을 통해 빠르고 쉬운 음성 인식 서비스를 제공하는 네이버 클라우드 플랫폼의 서비스입니다. 길이가 긴 오디오/비디오 파일의 텍스트 변환, 음성 메모, 영상 자막 생성, 통화 녹취록 관리 등 음성 기반 기능에 대한 API를 RESTful 형태로 제공합니다.
참고
CLOVA Speech 서비스는 길이가 긴 오디오/비디오 파일을 업로드하여 음성 인식 결과를 확인할 수 있습니다. 반면, CLOVA Speech Recognition(CSR) 서비스는 1분 이내의 명령형 음성 인식에 최적화되어 있습니다.
CLOVA Speech 공통 설정
CLOVA Speech API에서 공통으로 사용하는 요청 형식과 응답 형식을 설명합니다.
요청
공통 요청 형식을 설명합니다.
API URL
요청 API URL은 다음과 같습니다.
CLOVA Speech 도메인에서 생성된 API Gateway의 고유 InvokeURL
참고
InvokeURL을 확인하는 방법은 CLOVA Speech 사용 가이드를 참조해 주십시오.
요청 헤더
헤더에 대한 설명은 다음과 같습니다.
필드 | 필수 여부 | 설명 |
---|---|---|
Content-Type | Required | 요청 데이터의 형식
|
응답
공통 응답 형식을 설명합니다.
응답 상태 코드
응답 상태 코드에 대한 설명은 다음과 같습니다.
참고
네이버 클라우드 플랫폼에서 공통으로 사용하는 응답 상태 코드에 대한 정보는 Ncloud API 응답 상태 코드를 참조해 주십시오.
HTTP 상태 코드 | 코드 | 메시지 | 설명 |
---|---|---|---|
400 | 400 | Invalid request parameters | 입력한 요청 파라미터 값이 올바르지 않음 |
401 | 401 | Invalid secret | 입력한 Secret Key 값이 올바르지 않음 |
400 | STT002 | Invalid Content Type | application/octet-stream 이외의 Content-Type 이 입력됨 |
400 | STT003 | Empty Sound Data | 음성 데이터 누락 |
400 | STT005 | Invalid Language | 입력된 언어(lang ) 파라미터를 지원하지 않음 |
400 | STT004 | Empty Language | 언어(lang ) 파라미터 누락 |
413 | STT001 | Exceed Sound Data length | 입력된 음성 데이터 값이 허용 길이를 초과 (60초) |
500 | STT006 | Failed to pre-processing | 음성 인식 전처리 중 오류 발생
|
500 | STT998 | Failed to STT | 음성 인식 중 오류가 발생함
|
500 | STT999 | Internal Server Error | 내부 서버 오류
|
- | - | SUCCEEDED | 작업 성공 |
- | - | PROCESSING | 작업 진행 중 |
- | - | ERROR_SERVER_BUSY | 서버 여유 자원이 없음 |
- | - | ERROR_TOKEN_INVALID | 토큰이 존재하지 않음 |
- | - | ERROR_AUDIO_EMPTY | 음성 데이터 값이 존재하지 않음 |
- | - | ERROR_AUDIO_CONVERSION | 음성 변환 실패 |
- | - | ERROR_PARAMS_FORMAT_INVALID | 입력한 파라미터 형식이 JSON이 아님 |
- | - | ERROR_REQUEST_PARAMETER | 입력한 요청 파라미터가 올바르지 않음 |
- | - | ERROR_REQUEST_PARAMETER | 화자가 인식되지 않음 |
- | - | ERROR_INVALID_SECRET | 입력한 Secret Key 값이 올바르지 않음 |
- | - | ERROR_DATA_NOT_FOUND | 서버 내부 오류 |
- | - | ERROR_DATA_CONFLICT | 데이터 충돌 |
- | - | ERROR_INTERNAL_ERROR | 서버 내부 오류 |
- | - | ERROR_EXTERNAL_ERROR | 서비스 작동 불가능 |
- | - | ERROR_TOO_MANY_JOBS | 작업량 초과 |
- | - | ERROR_GATEWAY_TIMEOUT | 시간 초과 |
- | - | FAILED | 기타 오류 |
CLOVA Speech API
CLOVA Speech 서비스에서 제공하는 API에 대한 설명은 다음과 같습니다.
API | 설명 |
---|---|
장문 인식 > Object Storage 파일 인식 | 네이버 클라우드 플랫폼의 Object Storage에 저장되어 있는 미디어 파일의 고유 URL로 장문 인식 |
장문 인식 > 외부 파일 인식 | 공개되어 있는 음성 파일의 고유 URL로 장문 인식 |
장문 인식 > 로컬 파일 인식 | 로컬 파일에 대해 장문 인식 |
장문 인식 > 작업 상태 확인 | 비동기(async) 방식의 작업 상태 확인 |
단문 인식 | 최대 60초 길이의 짧은 음성 파일 인식 |
실시간 스트리밍 인식 | 실시간 음성 인식 및 텍스트 변환 |
CLOVA Speech 연관 리소스
CLOVA Speech API에 대한 사용자의 이해를 돕기 위해 다양한 연관 리소스를 제공하고 있습니다.
- CLOVA Speech API 사용 방법
- Ncloud 공통 응답 상태 코드: CLOVA Speech 서비스에서 사용하는 네이버 클라우드 플랫폼의 공통 응답 상태 코드 정보
- Object Storage 사용 가이드: CLOVA Speech 이용에 필요한 Object Storage 사용 방법
- Sub Account 사용 가이드: CLOVA Speech의 운영 권한 관리를 도와주는 Sub Account 사용 방법
- CLOVA Speech 서비스 사용 방법
- CLOVA Speech 사용 가이드: 네이버 클라우드 플랫폼 콘솔에서 CLOVA Speech 서비스 이용 관련 안내, 사용량 확인 및 통보 설정 방법
- CLOVA Speech 사용 준비: CLOVA Speech를 이용하기 위한 지원 사양, 지원 파일 형식, 이용 요금 안내
- Ncloud 사용 환경 가이드: VPC, Classic 환경 및 지원 여부에 관한 사용 가이드
- 요금 소개, 특징, 상세 기능: CLOVA Speech의 요금 체계, CLOVA Speech의 특징 및 상세 기능 요약
- 서비스 최신 소식: CLOVA Speech 관련 최신 소식
- 자주 하는 질문: CLOVA Speech 사용자들이 자주 하는 질문
- 문의하기: 사용 가이드를 통해서도 궁금증이 해결되지 않는 경우 직접 문의
이 문서가 도움이 되었습니까?