CLOVA Speech Recognition (CSR)の概要

Classic/VPC環境で利用できます。

CLOVA Speech Recognitionは、人の声をテキストに変換する NAVERクラウドプラットフォームのサービスです。CLOVA Speech Recognitionサービスでは、秘書アプリケーション、チャットボット、音声メモなどに活用するさまざまな音声認識機能関連の APIを RESTful形式で提供します。モバイル環境では、ユーザーの音声入力を受けるために、Androidと iOS SDKの形式で APIを提供します。

参考

CLOVA Speechは、長いオーディオ/ビデオファイルをアップロードしてそのオーディオ/ビデオファイルの音声認識結果を確認できます。一方、CSR(CLOVA Speech Recognition)サービスは、1分以内の命令型音声の認識に最適化されています。

CLOVA Speech Recognition(CSR)の共通設定

CLOVA Speech Recognition APIで共通して使用されるリクエスト形式とレスポンス形式を説明します。

リクエスト

共通リクエスト形式を説明します。

API URL

リクエスト API URLは次の通りです。

https://naveropenapi.apigw.ntruss.com/recog/v1

参考

モバイル環境でプラットフォーム別に APIを使用する方法の詳細は、Mobile SDK文書をご参照ください。

リクエストヘッダ

リクエストヘッダの説明は次の通りです。

フィールド	必須の有無	説明
`x-ncp-apigw-api-key-id`	Required	NAVERクラウドプラットフォームコンソールで Application登録後に発行された Client ID
`x-ncp-apigw-api-key`	Required	NAVERクラウドプラットフォームコンソールで Application登録後に発行された Client Secret
`Content-Type`	Required	リクエストデータの形式 `application/octet-stream`

参考

NAVERクラウドプラットフォームコンソールで Applicationを登録して APIの使用に必要な認証情報(Client ID、Client Secret)を発行する方法はの詳細は、CLOVA Speech Recognition (CSR)ご利用ガイドをご参照ください。
コンソールで Applicationを登録した後に APIが選択されているか [変更] ボタンをクリックして確認してください。選択されていないと429(Quota Exceed)エラーが発生します。

レスポンス

共通レスポンス形式を説明します。

レスポンスステータスコード

レスポンスステータスコードの説明は次の通りです。

STT (Speech-to-Text)

HTTPステータスコード	コード	メッセージ	説明
413	STT000	Request Entity Too Large	入力した音声データが有効なサイズを超過(最大3MB)
413	STT001	Exceed Sound Data length	入力した音声データが有効な長さを超過(最大60秒)
400	STT002	Invalid Content Type	`application/octet-stream`以外の`Content-Type`が入力される
400	STT003	Empty Sound Data	音声データが入力されていない
400	STT004	Empty Language	言語(`lang`)パラメータが入力されていない
400	STT005	Invalid Language	入力された言語(`lang`)パラメータをサポートしない
500	STT006	Failed to pre-processing	音声認識前処理中にエラーが発生音声データが正常な`wav`、`mp3`、`flac`ファイルであるかどうか確認が必要
400	STT007	Too Short Sound Data	音声データが短い(400ms以下)
500	STT998	Failed to STT	音声認識中にエラー発生カスタマーサポートに問い合わせる
500	STT999	Internal Server Error	内部サーバエラーカスタマーサポートに問い合わせる

Mobile SDK

HTTPステータスコード	コード	メッセージ	説明
-	10	ERROR_NETWORK_INITIALIZE	ネットワークリソースのリセット中にエラー発生
-	11	ERROR_NETWORK_FINALIZE	ネットワークリソースの解除中にエラー発生
-	12	ERROR_NETWORK_READ	ネットワークデータの受信中にエラー発生クライアント機器のネットワーク環境が遅いため、タイムアウトが発生
-	13	ERROR_NETWORK_WRITE	ネットワークデータの転送中にエラー発生クライアント機器のネットワーク環境が遅いため、タイムアウトが発生
-	14	ERROR_NETWORK_NACK	音声認識サーバでエラー発生クライアント機器のネットワーク環境が遅いため、音声パケットをサーバに時間内に送信できず、タイムアウトが発生
-	15	ERROR_INVALID_PACKET	無効なパケットの転送によりエラー発生
-	20	ERROR_AUDIO_INITIALIZE	オーディオリソースのリセット中にエラー発生オーディオ使用権限があるかどうか確認が必要
-	21	ERROR_AUDIO_FINALIZE	オーディオリソースの解除中にエラー発生
-	22	ERROR_AUDIO_RECORD	音声入力(録音)中にエラー発生オーディオ使用権限があるかどうか確認が必要
-	30	ERROR_SECURITY	認証権限エラー
-	40	ERROR_INVALID_RESULT	認識結果エラー
-	41	ERROR_TIMEOUT	一定時間以上、サーバに音声を送信できなかったか、認識結果を受け取れない
-	42	ERROR_NO_CLIENT_RUNNING	クライアントが音声認識を行わない状況で、特定の音声認識関連イベントを検知
-	50	ERROR_UNKNOWN_EVENT	クライアント内部で規定されていないイベントを検知
-	60	ERROR_VERSION	プロトコルバージョンエラー
-	61	ERROR_CLIENTINFO	クライアント情報エラー
-	62	ERROR_SERVER_POOL	音声認識用可用サーバが不足している
-	63	ERROR_SESSION_EXPIRED	音声認識サーバのセッション期限切れ
-	64	ERROR_SPEECH_SIZE_EXCEEDED	音声パケットサイズ超過
-	65	ERROR_EXCEED_TIME_LIMIT	認証用タイムスタンプでエラー発生
-	66	ERROR_WRONG_SERVICE_TYPE	無効なサービスタイプ(Service Type)
-	67	ERROR_WRONG_LANGUAGE_TYPE	無効な言語タイプ(Language Type)
-	70	ERROR_OPENAPI_AUTH	Open API認証時にエラーが発生 Client IDと登録された Package名(Android)または Bundle ID情報(iOS)に誤りがある
-	71	ERROR_QUOTA_OVERFLOW	定められた API呼び出し量制限(Quota)に到達

その他のエラーと問い合わせ

現象または問い合わせ	原因または解決方法
UnsatifiedLinkErrorエラーが発生	CSR APIは、armeabiと armeabi-v7aでビルドされたライブラリを提供開発中のアプリで使用するライブラリのうち、armeabiと armeabi-v7aをサポートしていないものがある場合、このエラーが発生することがある
android fatal signal 11 (sigsegv)エラーが発生	CSR APIを使用して音声の入力を受ける前にリソースの準備が必要 `recognize()`を呼び出す前に`initialize()`、`release()`が正常に呼び出されるのか確認
認識結果として`""(null)`が返される	ユーザーが非常に小さな声で発声したか、周囲の音で声が認識されなかった場合に発生することがあるごく稀に発生するが、認識結果が null(空の値)の場合も例外処理することがお勧め
オーディオファイルを認識	CSR APIはオーディオファイル認識をサポートしない
低スペックのスマートフォンでは正常に動作しない	Android SDKバージョンは10以降、iOSバージョンは8以降の機器をサポート

参考

NAVERクラウドプラットフォームで共通して使用されるレスポンスステータスコードの詳細は、Ncloud APIのレスポンスステータスコードをご参照ください。

CLOVA Speech Recognition API

CLOVA Speech Recognitionサービスで提供する APIの説明は次の通りです。

API	説明
STT (Speech-to-Text)	音声テキストを抽出
Mobile SDK	モバイル環境で音声テキストを抽出

CLOVA Speech Recognition関連リソース

CLOVA Speech Recognition APIについてユーザーの理解に役立つよう、さまざまな関連リソースを提供しています。

CLOVA Speech Recognition APIの使用方法
- APIの概要: NAVERクラウドプラットフォームから発行された Access Key、Secret Keyの発行と確認、リクエストヘッダに必要な署名の作成方法
- API Gatewayご利用ガイド: リクエストヘッダに必要な API Keyの確認方法
- Ncloudの共通レスポンスステータスコード: CLOVA Speech Recognitionサービスで使用される NAVERクラウドプラットフォームの共通レスポンスステータスコード情報
CLOVA Speech Recognitionサービスの使用方法
- CLOVA Speech Recognitionご利用ガイド: NAVERクラウドプラットフォームコンソールで CLOVA Speech Recognitionを使用する方法
- Ncloud使用環境ガイド: VPC、Classic環境とサポート有無に関するガイド
- 料金の紹介、特徴、詳細機能: CLOVA Speech Recognitionの料金体系、特徴、詳細機能のサマリー
- サービス関連の最新のお知らせ: CLOVA Speech Recognition関連の最新共有ニュース
- よくある質問: CLOVA Speech Recognitionユーザーからのよくある質問
- お問い合わせ: ご利用ガイドだけでは不明な点が解消されない場合、直接お問い合わせ