- 인쇄
- PDF
CLOVA Speech Recognition (CSR) 개요
- 인쇄
- PDF
Classic/VPC 환경에서 이용 가능합니다.
CLOVA Speech Recognition은 사람의 목소리를 텍스트로 변환하는 네이버 클라우드 플랫폼의 서비스입니다. CLOVA Speech Recognition 서비스에서는 비서 애플리케이션, 챗봇, 음성 메모 등에 활용하는 다양한 음성 인식 기능에 대한 API를 RESTful 형태로 제공합니다. 모바일 환경에서는 사용자의 음성 입력을 전달받기 위해 Android와 iOS SDK 형태로 API를 제공합니다.
CLOVA Speech는 길이가 긴 오디오/비디오 파일을 업로드하여 해당 오디오/비디오 파일의 음성 인식 결과를 확인할 수 있습니다. 반면, CSR (CLOVA Speech Recognition) 서비스는 1분 이내의 명령형 음성 인식에 최적화되어 있습니다.
CLOVA Speech Recognition (CSR) 공통 설정
CLOVA Speech Recognition API에서 공통으로 사용하는 요청 형식과 응답 형식을 설명합니다.
요청
공통 요청 형식을 설명합니다.
API URL
요청 API URL은 다음과 같습니다.
https://naveropenapi.apigw.ntruss.com/recog/v1
모바일 환경에서 플랫폼별로 API를 사용하는 방법은 Mobile SDK 문서를 참조해 주십시오.
요청 헤더
요청 헤더에 대한 설명은 다음과 같습니다.
필드 | 필수 여부 | 설명 |
---|---|---|
x-ncp-apigw-api-key-id | Required | 네이버 클라우드 플랫폼 콘솔에서 Application 등록 후 발급받은 Client ID |
x-ncp-apigw-api-key | Required | 네이버 클라우드 플랫폼 콘솔에서 Application 등록 후 발급받은 Client Secret |
Content-Type | Required | 요청 데이터의 형식
|
네이버 클라우드 플랫폼 콘솔에서 Application을 등록하여 API 사용에 필요한 인증 정보(Client ID, Client Secret)를 발급받는 방법은 CLOVA Speech Recognition (CSR) 사용 가이드를 참조해 주십시오.
콘솔에서 Application 등록 후 사용할 API가 선택되어 있는지 [수정] 버튼을 클릭하여 확인해 주십시오. 선택되어 있지 않으면 429 (Quota Exceed) 오류가 발생합니다.
응답
공통 응답 형식을 설명합니다.
응답 상태 코드
응답 상태 코드에 대한 설명은 다음과 같습니다.
- STT (Speech-to-Text)
HTTP 상태 코드 | 코드 | 메시지 | 설명 |
---|---|---|---|
413 | STT000 | Request Entity Too Large | 입력한 음성 데이터 값이 허용 용량 초과(최대 3 MB) |
413 | STT001 | Exceed Sound Data length | 입력한 음성 데이터 값이 허용 길이 초과(최대 60 초) |
400 | STT002 | Invalid Content Type | application/octet-stream 이외의 Content-Type 이 입력됨 |
400 | STT003 | Empty Sound Data | 음성 데이터가 입력되지 않음 |
400 | STT004 | Empty Language | 언어(lang ) 파라미터가 입력되지 않음 |
400 | STT005 | Invalid Language | 입력된 언어(lang ) 파라미터를 지원하지 않음 |
500 | STT006 | Failed to pre-processing | 음성 인식 전처리 중 오류 발생
|
400 | STT007 | Too Short Sound Data | 음성 데이터 길이가 짧음(400 ms 이하) |
500 | STT998 | Failed to STT | 음성 인식 중 오류 발생
|
500 | STT999 | Internal Server Error | 내부 서버 오류
|
- Mobile SDK
HTTP 상태 코드 | 코드 | 메시지 | 설명 |
---|---|---|---|
- | 10 | ERROR_NETWORK_INITIALIZE | 네트워크 자원 초기화 시 오류 발생 |
- | 11 | ERROR_NETWORK_FINALIZE | 네트워크 자원 해제 시 오류 발생 |
- | 12 | ERROR_NETWORK_READ | 네트워크 데이터 수신 시 오류 발생
|
- | 13 | ERROR_NETWORK_WRITE | 네트워크 데이터 전송 시 오류 발생
|
- | 14 | ERROR_NETWORK_NACK | 음성 인식 서버에서 오류 발생
|
- | 15 | ERROR_INVALID_PACKET | 유효하지 않은 패킷을 전송하여 오류 발생 |
- | 20 | ERROR_AUDIO_INITIALIZE | 오디오 자원 초기화 시 오류 발생
|
- | 21 | ERROR_AUDIO_FINALIZE | 오디오 자원 해제 시 오류 발생 |
- | 22 | ERROR_AUDIO_RECORD | 음성 입력(녹음) 시 오류 발생
|
- | 30 | ERROR_SECURITY | 인증 권한 오류 |
- | 40 | ERROR_INVALID_RESULT | 인식 결과 오류 |
- | 41 | ERROR_TIMEOUT | 일정 시간 이상 서버로 음성을 전송하지 못하거나 인식 결과를 받지 못함 |
- | 42 | ERROR_NO_CLIENT_RUNNING | 클라이언트가 음성 인식을 수행하지 않는 상황에서 특정 음성 인식 관련 이벤트 감지 |
- | 50 | ERROR_UNKNOWN_EVENT | 클라이언트 내부에 규정되어 있지 않은 이벤트 감지 |
- | 60 | ERROR_VERSION | 프로토콜 버전 오류 |
- | 61 | ERROR_CLIENTINFO | 클라이언트 정보 오류 |
- | 62 | ERROR_SERVER_POOL | 음성 인식 가용 서버가 부족함 |
- | 63 | ERROR_SESSION_EXPIRED | 음성 인식 서버 세션 만료 |
- | 64 | ERROR_SPEECH_SIZE_EXCEEDED | 음성 패킷 사이즈 초과 |
- | 65 | ERROR_EXCEED_TIME_LIMIT | 인증용 타임스탬프에서 오류 발생 |
- | 66 | ERROR_WRONG_SERVICE_TYPE | 올바른 서비스 타입(Service Type)이 아님 |
- | 67 | ERROR_WRONG_LANGUAGE_TYPE | 올바른 언어 타입(Language Type)이 아님 |
- | 70 | ERROR_OPENAPI_AUTH | Open API 인증 시 오류 발생
|
- | 71 | ERROR_QUOTA_OVERFLOW | 정해진 API 호출 제한량(Quota) 소진 |
- 기타 오류 및 문의
현상 또는 문의 | 원인 또는 해결 방법 |
---|---|
UnsatifiedLinkError 오류 발생 |
|
android fatal signal 11 (sigsegv) 오류 발생 |
|
인식 결과로 ""(null) 이 반환 |
|
오디오 파일 인식 | CSR API는 오디오 파일 인식 미지원 |
저사양 스마트폰에서 정상 작동하지 않음 | Android SDK 버전 10 이상, iOS 버전 8 이상의 기기 지원 |
네이버 클라우드 플랫폼에서 공통으로 사용하는 응답 상태 코드에 대한 정보는 Ncloud API 응답 상태 코드를 참조해 주십시오.
CLOVA Speech Recognition API
CLOVA Speech Recognition 서비스에서 제공하는 API에 대한 설명은 다음과 같습니다.
API | 설명 |
---|---|
STT (Speech-to-Text) | 음성 텍스트 추출 |
Mobile SDK | 모바일 환경에서 음성 텍스트 추출 |
CLOVA Speech Recognition 연관 리소스
CLOVA Speech Recognition API에 대한 사용자의 이해를 돕기 위해 다양한 연관 리소스를 제공하고 있습니다.
- CLOVA Speech Recognition API 사용 방법
- API 개요: 네이버 클라우드 플랫폼에서 발급받은 Access Key, Secret Key 발급 및 확인, 요청 헤더에 필요한 서명 생성 방법
- API Gateway 사용 가이드: 요청 헤더에 필요한 API Key 확인 방법
- Ncloud 공통 응답 상태 코드: CLOVA Speech Recognition 서비스에서 사용하는 네이버 클라우드 플랫폼의 공통 응답 상태 코드 정보
- CLOVA Speech Recognition 서비스 사용 방법
- CLOVA Speech Recognition 사용 가이드: 네이버 클라우드 플랫폼 콘솔에서 CLOVA Speech Recognition 사용하는 방법
- Ncloud 사용 환경 가이드: VPC, Classic 환경 및 지원 여부에 대한 가이드
- 요금 소개, 특징, 상세 기능: CLOVA Speech Recognition의 요금 체계, 특징, 상세 기능 요약
- 서비스 최신 소식: CLOVA Speech Recognition 관련 최신 소식
- 자주 하는 질문: CLOVA Speech Recognition 사용자들이 자주 하는 질문
- 문의하기: 사용 가이드를 통해서도 궁금증이 해결되지 않는 경우 직접 문의