Share feedback
Thanks for sharing your feedback!
Classic/VPC 환경에서 이용 가능합니다.
version
Version | Date | Changes |
---|
v1.0.0 | 2023.11.23. | 최초 작성 |
v1.0.1 | 2023.12.21. | 발음 평가(영어) 기능 추가 |
요청
Method | Request URI |
---|
POST | CLOVA Speech 도메인에서 생성된 API Gateway의 InvokeURL로 호출 |
API URL
Method | Request URI |
---|
POST | https://clovaspeech-gw.ncloud.com/recog/v1/stt |
요청 헤더
헤더명 | 설명 |
---|
X-CLOVASPEECH-API-KEY | {Secret Key} |
Content-Type | application/octet-stream |
Query Param
name | value | required | value |
---|
lang | string | true | Kor, Eng, Jpn, Chn |
assessment | bool | false | 발음평가 결과를 반환할지 결정하는 파라미터(Eng only) |
utterance | string | false | 발음 평가 대상 텍스트 |
graph | bool | false | 음성파형을 반환할지 결정하는 파라미터 |
- Assement는 영어(Eng) 선택 시 동작합니다.
응답
응답 바디
Field Name | Type | Description |
---|
text | string | 인식한 음원의 결괏값 |
quota | int | 음원 길이(15초 단위) |
assessment_score | int | 문장 전체의 발음 점수(0~100) |
ref_graph | int array | 기준 발음에 대한 음성 파형의 값 배열(양의 정수, 초당 50 샘플) |
usr_graph | int array | 입력 발음에 대한 음성 파형의 값 배열(양의 정수, 초당 50 샘플) |
Example (cURL shell)
curl --location 'https://clovaspeech-gw.ncloud.com/recog/v1/stt?lang=Eng&assessment=true&graph=true' \
--header 'X-CLOVASPEECH-API-KEY: ${secret key}' \
--header 'Content-Type: application/octet-stream' \
--data '@/D:/example.mp3'
{
"text": "sunday morning in an angry creditor",
"quota": 15, "assessment_score": 14, "assessment_details": "false|{f(f):45, a(ɔː):100, l(l):97, se(s):43} ",
"ref_graph": [
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 3, 4, 6, 8, 10, 11, 13, 15, 17, 18, 20, 21, 21, 22, 21, 21, 21, 20, 20, 19, 18, 17, 15, 14, 12, 11, 9, 7, 4, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0
],
"usr_graph": [
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 2, 4, 6, 7, 9, 11, 13, 15, 16, 18, 19, 20, 21, 21, 21, 21, 20, 20, 19, 18, 17, 16, 15, 13, 12, 10, 8, 6, 4, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0
]
}
오류 코드
{
"timestamp": 1700536699045,
"error": {
"errorCode": "STT005",
"message": "Invalid Language"
}
}
API 오류
HttpStatusCode | ErrorCode | ErrorMessage | Description |
---|
400 | 400 | - | Invalid request parameters |
401 | 401 | Invalid secret | Invalid secret |
413 | STT001 | Exceed Sound Data length | 허용 음성데이터 길이 초과(60초) |
400 | STT002 | Invalid Content Type | application/octet-stream 이외의 content-type인 경우 발생 |
400 | STT003 | Empty Sound Data | 음성 데이터가 입력되지 않음 |
400 | STT005 | Invalid Language | 정해진 언어 이외의 언어 값이 입력됨 |
400 | STT004 | Empty Language | 언어 파라미터가 입력되지 않음 |
500 | STT006 | Failed to pre-processing | 음성 인식 전처리 중 오류 발생 음성 데이터가 정상적인 wav, mp3, flac인지 확인 필요 |
500 | STT998 | Failed to STT | 음성 인식 중 오류 발생(고객지원을 통해 문의하면 신속히 조치 가능) |
500 | STT999 | Internal Server Error | 알 수 없는 오류 발생(고객지원을 통해 문의하면 신속히 조치 가능) |
의견을 보내 주셔서 감사합니다! 우리 팀이 당신에게 돌아갈 것입니다.