CLOVA Speech 개요

인쇄
공유
PDF

기사 요약

이 요약이 도움이 되었나요?

의견을 보내 주셔서 감사합니다.

Classic/VPC 환경에서 이용 가능합니다.

CLOVA Speech는 CLOVA의 NEST(Neural End-to-end Speech Transcriber) 음성 인식 기술을 통해 빠르고 쉬운 음성 인식 서비스를 제공하는 네이버 클라우드 플랫폼의 서비스입니다. 길이가 긴 오디오/비디오 파일의 텍스트 변환, 음성 메모, 영상 자막 생성, 통화 녹취록 관리 등 음성 기반 기능에 대한 API를 RESTful 형태로 제공합니다.

참고

CLOVA Speech 서비스는 길이가 긴 오디오/비디오 파일을 업로드하여 음성 인식 결과를 확인할 수 있습니다. 반면, CLOVA Speech Recognition(CSR) 서비스는 1분 이내의 명령형 음성 인식에 최적화되어 있습니다.

CLOVA Speech 공통 설정

CLOVA Speech API에서 공통으로 사용하는 요청 형식과 응답 형식을 설명합니다.

요청

공통 요청 형식을 설명합니다.

API URL

요청 API URL은 다음과 같습니다.

CLOVA Speech 도메인에서 생성된 API Gateway의 고유 InvokeURL

참고

InvokeURL을 확인하는 방법은 CLOVA Speech 사용 가이드를 참조해 주십시오.

요청 헤더

헤더에 대한 설명은 다음과 같습니다.

필드	필수 여부	설명
`Content-Type`	Required	요청 데이터의 형식 `application/json` \| `multipart/form-data` \| `application/octet-stream`

응답

공통 응답 형식을 설명합니다.

응답 상태 코드

응답 상태 코드에 대한 설명은 다음과 같습니다.

참고

네이버 클라우드 플랫폼에서 공통으로 사용하는 응답 상태 코드에 대한 정보는 Ncloud API 응답 상태 코드를 참조해 주십시오.

HTTP 상태 코드	코드	메시지	설명
400	400	Invalid request parameters	입력한 요청 파라미터 값이 올바르지 않음
401	401	Invalid secret	입력한 Secret Key 값이 올바르지 않음
400	STT002	Invalid Content Type	`application/octet-stream` 이외의 `Content-Type`이 입력됨
400	STT003	Empty Sound Data	음성 데이터 누락
400	STT005	Invalid Language	입력된 언어(`lang`) 파라미터를 지원하지 않음
400	STT004	Empty Language	언어(`lang`) 파라미터 누락
413	STT001	Exceed Sound Data length	입력된 음성 데이터 값이 허용 길이를 초과 (60초)
500	STT006	Failed to pre-processing	음성 인식 전처리 중 오류 발생 음성 데이터가 정상적인 `wav`, `mp3`, `flac` 인지 확인 필요
500	STT998	Failed to STT	음성 인식 중 오류가 발생함 고객 지원 문의 필요
500	STT999	Internal Server Error	내부 서버 오류 고객 지원 문의 필요
-	-	SUCCEEDED	작업 성공
-	-	PROCESSING	작업 진행 중
-	-	ERROR_SERVER_BUSY	서버 여유 자원이 없음
-	-	ERROR_TOKEN_INVALID	토큰이 존재하지 않음
-	-	ERROR_AUDIO_EMPTY	음성 데이터 값이 존재하지 않음
-	-	ERROR_AUDIO_CONVERSION	음성 변환 실패
-	-	ERROR_PARAMS_FORMAT_INVALID	입력한 파라미터 형식이 JSON이 아님
-	-	ERROR_REQUEST_PARAMETER	입력한 요청 파라미터가 올바르지 않음
-	-	ERROR_REQUEST_PARAMETER	화자가 인식되지 않음
-	-	ERROR_INVALID_SECRET	입력한 Secret Key 값이 올바르지 않음
-	-	ERROR_DATA_NOT_FOUND	서버 내부 오류
-	-	ERROR_DATA_CONFLICT	데이터 충돌
-	-	ERROR_INTERNAL_ERROR	서버 내부 오류
-	-	ERROR_EXTERNAL_ERROR	서비스 작동 불가능
-	-	ERROR_TOO_MANY_JOBS	작업량 초과
-	-	ERROR_GATEWAY_TIMEOUT	시간 초과
-	-	FAILED	기타 오류

CLOVA Speech API

CLOVA Speech 서비스에서 제공하는 API에 대한 설명은 다음과 같습니다.

API	설명
장문 인식 > Object Storage 파일 인식	네이버 클라우드 플랫폼의 Object Storage에 저장되어 있는 미디어 파일의 고유 URL로 장문 인식
장문 인식 > 외부 파일 인식	공개되어 있는 음성 파일의 고유 URL로 장문 인식
장문 인식 > 로컬 파일 인식	로컬 파일에 대해 장문 인식
장문 인식 > 작업 상태 확인	비동기(async) 방식의 작업 상태 확인
단문 인식	최대 60초 길이의 짧은 음성 파일 인식
실시간 스트리밍 인식	실시간 음성 인식 및 텍스트 변환

CLOVA Speech 연관 리소스

CLOVA Speech API에 대한 사용자의 이해를 돕기 위해 다양한 연관 리소스를 제공하고 있습니다.

CLOVA Speech API 사용 방법
- Ncloud 공통 응답 상태 코드: CLOVA Speech 서비스에서 사용하는 네이버 클라우드 플랫폼의 공통 응답 상태 코드 정보
- Object Storage 사용 가이드: CLOVA Speech 이용에 필요한 Object Storage 사용 방법
- Sub Account 사용 가이드: CLOVA Speech의 운영 권한 관리를 도와주는 Sub Account 사용 방법
CLOVA Speech 서비스 사용 방법
- CLOVA Speech 사용 가이드: 네이버 클라우드 플랫폼 콘솔에서 CLOVA Speech 서비스 이용 관련 안내, 사용량 확인 및 통보 설정 방법
- CLOVA Speech 사용 준비: CLOVA Speech를 이용하기 위한 지원 사양, 지원 파일 형식, 이용 요금 안내
- Ncloud 사용 환경 가이드: VPC, Classic 환경 및 지원 여부에 관한 사용 가이드
- 요금 소개, 특징, 상세 기능: CLOVA Speech의 요금 체계, CLOVA Speech의 특징 및 상세 기능 요약
- 서비스 최신 소식: CLOVA Speech 관련 최신 소식
- 자주 하는 질문: CLOVA Speech 사용자들이 자주 하는 질문
- 문의하기: 사용 가이드를 통해서도 궁금증이 해결되지 않는 경우 직접 문의

이 문서가 도움이 되었습니까?

What's Next

Object Storage 파일 인식

CLOVA Speech 공통 설정
CLOVA Speech API
CLOVA Speech 연관 리소스

태그

CLOVA Speech