CLOVA Speech Recognition (CSR) 개요

Prev Next

Classic/VPC 환경에서 이용 가능합니다.

CLOVA Speech Recognition은 사람의 목소리를 텍스트로 변환하는 네이버 클라우드 플랫폼의 서비스입니다. CLOVA Speech Recognition 서비스에서는 비서 애플리케이션, 챗봇, 음성 메모 등에 활용하는 다양한 음성 인식 기능에 대한 API를 RESTful 형태로 제공합니다. 모바일 환경에서는 사용자의 음성 입력을 전달받기 위해 Android와 iOS SDK 형태로 API를 제공합니다.

참고

CLOVA Speech는 길이가 긴 오디오/비디오 파일을 업로드하여 해당 오디오/비디오 파일의 음성 인식 결과를 확인할 수 있습니다. 반면, CSR (CLOVA Speech Recognition) 서비스는 1분 이내의 명령형 음성 인식에 최적화되어 있습니다.

CLOVA Speech Recognition (CSR) 공통 설정

CLOVA Speech Recognition API에서 공통으로 사용하는 요청 형식과 응답 형식을 설명합니다.

요청

공통 요청 형식을 설명합니다.

API URL

요청 API URL은 다음과 같습니다.

https://naveropenapi.apigw.ntruss.com/recog/v1
참고

모바일 환경에서 플랫폼별로 API를 사용하는 방법은 Mobile SDK 문서를 참조해 주십시오.

요청 헤더

요청 헤더에 대한 설명은 다음과 같습니다.

필드 필수 여부 설명
x-ncp-apigw-api-key-id Required 네이버 클라우드 플랫폼 콘솔에서 Application 등록 후 발급받은 Client ID
x-ncp-apigw-api-key Required 네이버 클라우드 플랫폼 콘솔에서 Application 등록 후 발급받은 Client Secret
Content-Type Required 요청 데이터의 형식
  • application/octet-stream
참고

네이버 클라우드 플랫폼 콘솔에서 Application을 등록하여 API 사용에 필요한 인증 정보(Client ID, Client Secret)를 발급받는 방법은 CLOVA Speech Recognition (CSR) 사용 가이드를 참조해 주십시오.
콘솔에서 Application 등록 후 사용할 API가 선택되어 있는지 [수정] 버튼을 클릭하여 확인해 주십시오. 선택되어 있지 않으면 429 (Quota Exceed) 오류가 발생합니다.

응답

공통 응답 형식을 설명합니다.

응답 상태 코드

응답 상태 코드에 대한 설명은 다음과 같습니다.

  • STT (Speech-to-Text)
HTTP 상태 코드 코드 메시지 설명
413 STT000 Request Entity Too Large 입력한 음성 데이터 값이 허용 용량 초과(최대 3 MB)
413 STT001 Exceed Sound Data length 입력한 음성 데이터 값이 허용 길이 초과(최대 60 초)
400 STT002 Invalid Content Type application/octet-stream 이외의 Content-Type이 입력됨
400 STT003 Empty Sound Data 음성 데이터가 입력되지 않음
400 STT004 Empty Language 언어(lang) 파라미터가 입력되지 않음
400 STT005 Invalid Language 입력된 언어(lang) 파라미터를 지원하지 않음
500 STT006 Failed to pre-processing 음성 인식 전처리 중 오류 발생
  • 음성 데이터가 정상적인 wav, mp3, flac 파일인지 확인 필요
400 STT007 Too Short Sound Data 음성 데이터 길이가 짧음(400 ms 이하)
500 STT998 Failed to STT 음성 인식 중 오류 발생
  • 고객지원 문의
500 STT999 Internal Server Error 내부 서버 오류
  • 고객지원 문의
  • Mobile SDK
HTTP 상태 코드 코드 메시지 설명
- 10 ERROR_NETWORK_INITIALIZE 네트워크 자원 초기화 시 오류 발생
- 11 ERROR_NETWORK_FINALIZE 네트워크 자원 해제 시 오류 발생
- 12 ERROR_NETWORK_READ 네트워크 데이터 수신 시 오류 발생
  • 클라이언트 기기의 네트워크 환경이 느려서 타임아웃 발생
- 13 ERROR_NETWORK_WRITE 네트워크 데이터 전송 시 오류 발생
  • 클라이언트 기기의 네트워크 환경이 느려서 타임아웃 발생
- 14 ERROR_NETWORK_NACK 음성 인식 서버에서 오류 발생
  • 클라이언트 기기의 네트워크 환경이 느려서 음성 패킷을 서버에 제시간에 보내지 못해 타임아웃 발생
- 15 ERROR_INVALID_PACKET 유효하지 않은 패킷을 전송하여 오류 발생
- 20 ERROR_AUDIO_INITIALIZE 오디오 자원 초기화 시 오류 발생
  • 오디오 사용 권한 여부 확인 요망
- 21 ERROR_AUDIO_FINALIZE 오디오 자원 해제 시 오류 발생
- 22 ERROR_AUDIO_RECORD 음성 입력(녹음) 시 오류 발생
  • 오디오 사용 권한 여부 확인 요망
- 30 ERROR_SECURITY 인증 권한 오류
- 40 ERROR_INVALID_RESULT 인식 결과 오류
- 41 ERROR_TIMEOUT 일정 시간 이상 서버로 음성을 전송하지 못하거나 인식 결과를 받지 못함
- 42 ERROR_NO_CLIENT_RUNNING 클라이언트가 음성 인식을 수행하지 않는 상황에서 특정 음성 인식 관련 이벤트 감지
- 50 ERROR_UNKNOWN_EVENT 클라이언트 내부에 규정되어 있지 않은 이벤트 감지
- 60 ERROR_VERSION 프로토콜 버전 오류
- 61 ERROR_CLIENTINFO 클라이언트 정보 오류
- 62 ERROR_SERVER_POOL 음성 인식 가용 서버가 부족함
- 63 ERROR_SESSION_EXPIRED 음성 인식 서버 세션 만료
- 64 ERROR_SPEECH_SIZE_EXCEEDED 음성 패킷 사이즈 초과
- 65 ERROR_EXCEED_TIME_LIMIT 인증용 타임스탬프에서 오류 발생
- 66 ERROR_WRONG_SERVICE_TYPE 올바른 서비스 타입(Service Type)이 아님
- 67 ERROR_WRONG_LANGUAGE_TYPE 올바른 언어 타입(Language Type)이 아님
- 70 ERROR_OPENAPI_AUTH Open API 인증 시 오류 발생
  • Client ID와 등록된 Package 이름(Android) 또는 Bundle ID 정보(iOS)가 잘못됨
- 71 ERROR_QUOTA_OVERFLOW 정해진 API 호출 제한량(Quota) 소진
  • 기타 오류 및 문의
현상 또는 문의 원인 또는 해결 방법
UnsatifiedLinkError 오류 발생
  • CSR API는 armeabi와 armeabi-v7a로 빌드된 라이브러리 제공
  • 개발 중인 앱에서 사용하는 라이브러리 중 armeabi와 armeabi-v7a를 지원하지 않는 것이 있다면 해당 오류 발생 가능
android fatal signal 11 (sigsegv) 오류 발생
  • CSR API를 사용하여 음성을 입력받기 전 사전에 자원을 준비해야 함
  • recognize() 호출 전 initialize(), release() 가 잘 호출되는지 확인
인식 결과로 ""(null)이 반환
  • 사용자가 매우 작은 목소리로 발성하였거나, 주변 소리로 인해 목소리가 인식되지 않았을 경우 발생 가능
  • 극히 드물게 발생하지만 인식 결과가 null(빈 값)일 때도 예외 처리해주는 것을 권장
오디오 파일 인식 CSR API는 오디오 파일 인식 미지원
저사양 스마트폰에서 정상 작동하지 않음 Android SDK 버전 10 이상, iOS 버전 8 이상의 기기 지원
참고

네이버 클라우드 플랫폼에서 공통으로 사용하는 응답 상태 코드에 대한 정보는 Ncloud API 응답 상태 코드를 참조해 주십시오.

CLOVA Speech Recognition API

CLOVA Speech Recognition 서비스에서 제공하는 API에 대한 설명은 다음과 같습니다.

API 설명
STT (Speech-to-Text) 음성 텍스트 추출
Mobile SDK 모바일 환경에서 음성 텍스트 추출

CLOVA Speech Recognition 연관 리소스

CLOVA Speech Recognition API에 대한 사용자의 이해를 돕기 위해 다양한 연관 리소스를 제공하고 있습니다.