CLOVA Speech Recognition (CSR)の概要

Prev Next

Classic/VPC環境で利用できます。

CLOVA Speech Recognitionは、人の声をテキストに変換する NAVERクラウドプラットフォームのサービスです。CLOVA Speech Recognitionサービスでは、秘書アプリケーション、チャットボット、音声メモなどに活用するさまざまな音声認識機能関連の APIを RESTful形式で提供します。モバイル環境では、ユーザーの音声入力を受けるために、Androidと iOS SDKの形式で APIを提供します。

参考

CLOVA Speechは、長いオーディオ/ビデオファイルをアップロードしてそのオーディオ/ビデオファイルの音声認識結果を確認できます。一方、CSR(CLOVA Speech Recognition)サービスは、1分以内の命令型音声の認識に最適化されています。

CLOVA Speech Recognition(CSR)の共通設定

CLOVA Speech Recognition APIで共通して使用されるリクエスト形式とレスポンス形式を説明します。

リクエスト

共通リクエスト形式を説明します。

API URL

リクエスト API URLは次の通りです。

https://naveropenapi.apigw.ntruss.com/recog/v1
参考

モバイル環境でプラットフォーム別に APIを使用する方法の詳細は、Mobile SDK文書をご参照ください。

リクエストヘッダ

リクエストヘッダの説明は次の通りです。

フィールド 必須の有無 説明
x-ncp-apigw-api-key-id Required NAVERクラウドプラットフォームコンソールで Application登録後に発行された Client ID
x-ncp-apigw-api-key Required NAVERクラウドプラットフォームコンソールで Application登録後に発行された Client Secret
Content-Type Required リクエストデータの形式
  • application/octet-stream
参考

NAVERクラウドプラットフォームコンソールで Applicationを登録して APIの使用に必要な認証情報(Client ID、Client Secret)を発行する方法はの詳細は、CLOVA Speech Recognition (CSR)ご利用ガイドをご参照ください。
コンソールで Applicationを登録した後に APIが選択されているか [変更] ボタンをクリックして確認してください。選択されていないと429(Quota Exceed)エラーが発生します。

レスポンス

共通レスポンス形式を説明します。

レスポンスステータスコード

レスポンスステータスコードの説明は次の通りです。

  • STT (Speech-to-Text)
HTTPステータスコード コード メッセージ 説明
413 STT000 Request Entity Too Large 入力した音声データが有効なサイズを超過(最大3MB)
413 STT001 Exceed Sound Data length 入力した音声データが有効な長さを超過(最大60秒)
400 STT002 Invalid Content Type application/octet-stream以外のContent-Typeが入力される
400 STT003 Empty Sound Data 音声データが入力されていない
400 STT004 Empty Language 言語(lang)パラメータが入力されていない
400 STT005 Invalid Language 入力された言語(lang)パラメータをサポートしない
500 STT006 Failed to pre-processing 音声認識前処理中にエラーが発生
  • 音声データが正常なwavmp3flacファイルであるかどうか確認が必要
400 STT007 Too Short Sound Data 音声データが短い(400ms以下)
500 STT998 Failed to STT 音声認識中にエラー発生
  • カスタマーサポートに問い合わせる
500 STT999 Internal Server Error 内部サーバエラー
  • カスタマーサポートに問い合わせる
  • Mobile SDK
HTTPステータスコード コード メッセージ 説明
- 10 ERROR_NETWORK_INITIALIZE ネットワークリソースのリセット中にエラー発生
- 11 ERROR_NETWORK_FINALIZE ネットワークリソースの解除中にエラー発生
- 12 ERROR_NETWORK_READ ネットワークデータの受信中にエラー発生
  • クライアント機器のネットワーク環境が遅いため、タイムアウトが発生
- 13 ERROR_NETWORK_WRITE ネットワークデータの転送中にエラー発生
  • クライアント機器のネットワーク環境が遅いため、タイムアウトが発生
- 14 ERROR_NETWORK_NACK 音声認識サーバでエラー発生
  • クライアント機器のネットワーク環境が遅いため、音声パケットをサーバに時間内に送信できず、タイムアウトが発生
- 15 ERROR_INVALID_PACKET 無効なパケットの転送によりエラー発生
- 20 ERROR_AUDIO_INITIALIZE オーディオリソースのリセット中にエラー発生
  • オーディオ使用権限があるかどうか確認が必要
- 21 ERROR_AUDIO_FINALIZE オーディオリソースの解除中にエラー発生
- 22 ERROR_AUDIO_RECORD 音声入力(録音)中にエラー発生
  • オーディオ使用権限があるかどうか確認が必要
- 30 ERROR_SECURITY 認証権限エラー
- 40 ERROR_INVALID_RESULT 認識結果エラー
- 41 ERROR_TIMEOUT 一定時間以上、サーバに音声を送信できなかったか、認識結果を受け取れない
- 42 ERROR_NO_CLIENT_RUNNING クライアントが音声認識を行わない状況で、特定の音声認識関連イベントを検知
- 50 ERROR_UNKNOWN_EVENT クライアント内部で規定されていないイベントを検知
- 60 ERROR_VERSION プロトコルバージョンエラー
- 61 ERROR_CLIENTINFO クライアント情報エラー
- 62 ERROR_SERVER_POOL 音声認識用可用サーバが不足している
- 63 ERROR_SESSION_EXPIRED 音声認識サーバのセッション期限切れ
- 64 ERROR_SPEECH_SIZE_EXCEEDED 音声パケットサイズ超過
- 65 ERROR_EXCEED_TIME_LIMIT 認証用タイムスタンプでエラー発生
- 66 ERROR_WRONG_SERVICE_TYPE 無効なサービスタイプ(Service Type)
- 67 ERROR_WRONG_LANGUAGE_TYPE 無効な言語タイプ(Language Type)
- 70 ERROR_OPENAPI_AUTH Open API認証時にエラーが発生
  • Client IDと登録された Package名(Android)または Bundle ID情報(iOS)に誤りがある
- 71 ERROR_QUOTA_OVERFLOW 定められた API呼び出し量制限(Quota)に到達
  • その他のエラーと問い合わせ
現象または問い合わせ 原因または解決方法
UnsatifiedLinkErrorエラーが発生
  • CSR APIは、armeabiと armeabi-v7aでビルドされたライブラリを提供
  • 開発中のアプリで使用するライブラリのうち、armeabiと armeabi-v7aをサポートしていないものがある場合、このエラーが発生することがある
android fatal signal 11 (sigsegv)エラーが発生
  • CSR APIを使用して音声の入力を受ける前にリソースの準備が必要
  • recognize()を呼び出す前にinitialize()release()が正常に呼び出されるのか確認
認識結果として""(null)が返される
  • ユーザーが非常に小さな声で発声したか、周囲の音で声が認識されなかった場合に発生することがある
  • ごく稀に発生するが、認識結果が null(空の値)の場合も例外処理することがお勧め
オーディオファイルを認識 CSR APIはオーディオファイル認識をサポートしない
低スペックのスマートフォンでは正常に動作しない Android SDKバージョンは10以降、iOSバージョンは8以降の機器をサポート
参考

NAVERクラウドプラットフォームで共通して使用されるレスポンスステータスコードの詳細は、Ncloud APIのレスポンスステータスコードをご参照ください。

CLOVA Speech Recognition API

CLOVA Speech Recognitionサービスで提供する APIの説明は次の通りです。

API 説明
STT (Speech-to-Text) 音声テキストを抽出
Mobile SDK モバイル環境で音声テキストを抽出

CLOVA Speech Recognition関連リソース

CLOVA Speech Recognition APIについてユーザーの理解に役立つよう、さまざまな関連リソースを提供しています。