- 印刷する
- PDF
CLOVA Speech Recognition (CSR)の概要
- 印刷する
- PDF
Classic/VPC環境で利用できます。
CLOVA Speech Recognitionは、人の声をテキストに変換する NAVERクラウドプラットフォームのサービスです。CLOVA Speech Recognitionサービスでは、秘書アプリケーション、チャットボット、音声メモなどに活用するさまざまな音声認識機能関連の APIを RESTful形式で提供します。モバイル環境では、ユーザーの音声入力を受けるために、Androidと iOS SDKの形式で APIを提供します。
CLOVA Speechは、長いオーディオ/ビデオファイルをアップロードしてそのオーディオ/ビデオファイルの音声認識結果を確認できます。一方、CSR(CLOVA Speech Recognition)サービスは、1分以内の命令型音声の認識に最適化されています。
CLOVA Speech Recognition(CSR)の共通設定
CLOVA Speech Recognition APIで共通して使用されるリクエスト形式とレスポンス形式を説明します。
リクエスト
共通リクエスト形式を説明します。
API URL
リクエスト API URLは次の通りです。
https://naveropenapi.apigw.ntruss.com/recog/v1
モバイル環境でプラットフォーム別に APIを使用する方法の詳細は、Mobile SDK文書をご参照ください。
リクエストヘッダ
リクエストヘッダの説明は次の通りです。
フィールド | 必須の有無 | 説明 |
---|---|---|
x-ncp-apigw-api-key-id | Required | NAVERクラウドプラットフォームコンソールで Application登録後に発行された Client ID |
x-ncp-apigw-api-key | Required | NAVERクラウドプラットフォームコンソールで Application登録後に発行された Client Secret |
Content-Type | Required | リクエストデータの形式
|
NAVERクラウドプラットフォームコンソールで Applicationを登録して APIの使用に必要な認証情報(Client ID、Client Secret)を発行する方法はの詳細は、CLOVA Speech Recognition (CSR)ご利用ガイドをご参照ください。
コンソールで Applicationを登録した後に APIが選択されているか [変更] ボタンをクリックして確認してください。選択されていないと429(Quota Exceed)エラーが発生します。
レスポンス
共通レスポンス形式を説明します。
レスポンスステータスコード
レスポンスステータスコードの説明は次の通りです。
- STT (Speech-to-Text)
HTTPステータスコード | コード | メッセージ | 説明 |
---|---|---|---|
413 | STT000 | Request Entity Too Large | 入力した音声データが有効なサイズを超過(最大3MB) |
413 | STT001 | Exceed Sound Data length | 入力した音声データが有効な長さを超過(最大60秒) |
400 | STT002 | Invalid Content Type | application/octet-stream 以外のContent-Type が入力される |
400 | STT003 | Empty Sound Data | 音声データが入力されていない |
400 | STT004 | Empty Language | 言語(lang )パラメータが入力されていない |
400 | STT005 | Invalid Language | 入力された言語(lang )パラメータをサポートしない |
500 | STT006 | Failed to pre-processing | 音声認識前処理中にエラーが発生
|
400 | STT007 | Too Short Sound Data | 音声データが短い(400ms以下) |
500 | STT998 | Failed to STT | 音声認識中にエラー発生
|
500 | STT999 | Internal Server Error | 内部サーバエラー
|
- Mobile SDK
HTTPステータスコード | コード | メッセージ | 説明 |
---|---|---|---|
- | 10 | ERROR_NETWORK_INITIALIZE | ネットワークリソースのリセット中にエラー発生 |
- | 11 | ERROR_NETWORK_FINALIZE | ネットワークリソースの解除中にエラー発生 |
- | 12 | ERROR_NETWORK_READ | ネットワークデータの受信中にエラー発生
|
- | 13 | ERROR_NETWORK_WRITE | ネットワークデータの転送中にエラー発生
|
- | 14 | ERROR_NETWORK_NACK | 音声認識サーバでエラー発生
|
- | 15 | ERROR_INVALID_PACKET | 無効なパケットの転送によりエラー発生 |
- | 20 | ERROR_AUDIO_INITIALIZE | オーディオリソースのリセット中にエラー発生
|
- | 21 | ERROR_AUDIO_FINALIZE | オーディオリソースの解除中にエラー発生 |
- | 22 | ERROR_AUDIO_RECORD | 音声入力(録音)中にエラー発生
|
- | 30 | ERROR_SECURITY | 認証権限エラー |
- | 40 | ERROR_INVALID_RESULT | 認識結果エラー |
- | 41 | ERROR_TIMEOUT | 一定時間以上、サーバに音声を送信できなかったか、認識結果を受け取れない |
- | 42 | ERROR_NO_CLIENT_RUNNING | クライアントが音声認識を行わない状況で、特定の音声認識関連イベントを検知 |
- | 50 | ERROR_UNKNOWN_EVENT | クライアント内部で規定されていないイベントを検知 |
- | 60 | ERROR_VERSION | プロトコルバージョンエラー |
- | 61 | ERROR_CLIENTINFO | クライアント情報エラー |
- | 62 | ERROR_SERVER_POOL | 音声認識用可用サーバが不足している |
- | 63 | ERROR_SESSION_EXPIRED | 音声認識サーバのセッション期限切れ |
- | 64 | ERROR_SPEECH_SIZE_EXCEEDED | 音声パケットサイズ超過 |
- | 65 | ERROR_EXCEED_TIME_LIMIT | 認証用タイムスタンプでエラー発生 |
- | 66 | ERROR_WRONG_SERVICE_TYPE | 無効なサービスタイプ(Service Type) |
- | 67 | ERROR_WRONG_LANGUAGE_TYPE | 無効な言語タイプ(Language Type) |
- | 70 | ERROR_OPENAPI_AUTH | Open API認証時にエラーが発生
|
- | 71 | ERROR_QUOTA_OVERFLOW | 定められた API呼び出し量制限(Quota)に到達 |
- その他のエラーと問い合わせ
現象または問い合わせ | 原因または解決方法 |
---|---|
UnsatifiedLinkErrorエラーが発生 |
|
android fatal signal 11 (sigsegv)エラーが発生 |
|
認識結果として""(null) が返される |
|
オーディオファイルを認識 | CSR APIはオーディオファイル認識をサポートしない |
低スペックのスマートフォンでは正常に動作しない | Android SDKバージョンは10以降、iOSバージョンは8以降の機器をサポート |
NAVERクラウドプラットフォームで共通して使用されるレスポンスステータスコードの詳細は、Ncloud APIのレスポンスステータスコードをご参照ください。
CLOVA Speech Recognition API
CLOVA Speech Recognitionサービスで提供する APIの説明は次の通りです。
API | 説明 |
---|---|
STT (Speech-to-Text) | 音声テキストを抽出 |
Mobile SDK | モバイル環境で音声テキストを抽出 |
CLOVA Speech Recognition関連リソース
CLOVA Speech Recognition APIについてユーザーの理解に役立つよう、さまざまな関連リソースを提供しています。
- CLOVA Speech Recognition APIの使用方法
- APIの概要: NAVERクラウドプラットフォームから発行された Access Key、Secret Keyの発行と確認、リクエストヘッダに必要な署名の作成方法
- API Gatewayご利用ガイド: リクエストヘッダに必要な API Keyの確認方法
- Ncloudの共通レスポンスステータスコード: CLOVA Speech Recognitionサービスで使用される NAVERクラウドプラットフォームの共通レスポンスステータスコード情報
- CLOVA Speech Recognitionサービスの使用方法
- CLOVA Speech Recognitionご利用ガイド: NAVERクラウドプラットフォームコンソールで CLOVA Speech Recognitionを使用する方法
- Ncloud使用環境ガイド: VPC、Classic環境とサポート有無に関するガイド
- 料金の紹介、特徴、詳細機能: CLOVA Speech Recognitionの料金体系、特徴、詳細機能のサマリー
- サービス関連の最新のお知らせ: CLOVA Speech Recognition関連の最新共有ニュース
- よくある質問: CLOVA Speech Recognitionユーザーからのよくある質問
- お問い合わせ: ご利用ガイドだけでは不明な点が解消されない場合、直接お問い合わせ