CLOVA Speech Recognition (CSR)の概要
    • PDF

    CLOVA Speech Recognition (CSR)の概要

    • PDF

    記事の要約

    Classic/VPC環境で利用できます。

    CLOVA Speech Recognitionは、人の声をテキストに変換する NAVERクラウドプラットフォームのサービスです。CLOVA Speech Recognitionサービスでは、秘書アプリケーション、チャットボット、音声メモなどに活用するさまざまな音声認識機能関連の APIを RESTful形式で提供します。モバイル環境では、ユーザーの音声入力を受けるために、Androidと iOS SDKの形式で APIを提供します。

    参考

    CLOVA Speechは、長いオーディオ/ビデオファイルをアップロードしてそのオーディオ/ビデオファイルの音声認識結果を確認できます。一方、CSR(CLOVA Speech Recognition)サービスは、1分以内の命令型音声の認識に最適化されています。

    CLOVA Speech Recognition(CSR)の共通設定

    CLOVA Speech Recognition APIで共通して使用されるリクエスト形式とレスポンス形式を説明します。

    リクエスト

    共通リクエスト形式を説明します。

    API URL

    リクエスト API URLは次の通りです。

    https://naveropenapi.apigw.ntruss.com/recog/v1
    
    参考

    モバイル環境でプラットフォーム別に APIを使用する方法の詳細は、Mobile SDK文書をご参照ください。

    リクエストヘッダ

    リクエストヘッダの説明は次の通りです。

    フィールド必須の有無説明
    x-ncp-apigw-api-key-idRequiredNAVERクラウドプラットフォームコンソールで Application登録後に発行された Client ID
    x-ncp-apigw-api-keyRequiredNAVERクラウドプラットフォームコンソールで Application登録後に発行された Client Secret
    Content-TypeRequiredリクエストデータの形式
    • application/octet-stream
    参考

    NAVERクラウドプラットフォームコンソールで Applicationを登録して APIの使用に必要な認証情報(Client ID、Client Secret)を発行する方法はの詳細は、CLOVA Speech Recognition (CSR)ご利用ガイドをご参照ください。
    コンソールで Applicationを登録した後に APIが選択されているか [変更] ボタンをクリックして確認してください。選択されていないと429(Quota Exceed)エラーが発生します。

    レスポンス

    共通レスポンス形式を説明します。

    レスポンスステータスコード

    レスポンスステータスコードの説明は次の通りです。

    • STT (Speech-to-Text)
    HTTPステータスコードコードメッセージ説明
    413STT000Request Entity Too Large入力した音声データが有効なサイズを超過(最大3MB)
    413STT001Exceed Sound Data length入力した音声データが有効な長さを超過(最大60秒)
    400STT002Invalid Content Typeapplication/octet-stream以外のContent-Typeが入力される
    400STT003Empty Sound Data音声データが入力されていない
    400STT004Empty Language言語(lang)パラメータが入力されていない
    400STT005Invalid Language入力された言語(lang)パラメータをサポートしない
    500STT006Failed to pre-processing音声認識前処理中にエラーが発生
    • 音声データが正常なwavmp3flacファイルであるかどうか確認が必要
    400STT007Too Short Sound Data音声データが短い(400ms以下)
    500STT998Failed to STT音声認識中にエラー発生
    • カスタマーサポートに問い合わせる
    500STT999Internal Server Error内部サーバエラー
    • カスタマーサポートに問い合わせる
    • Mobile SDK
    HTTPステータスコードコードメッセージ説明
    -10ERROR_NETWORK_INITIALIZEネットワークリソースのリセット中にエラー発生
    -11ERROR_NETWORK_FINALIZEネットワークリソースの解除中にエラー発生
    -12ERROR_NETWORK_READネットワークデータの受信中にエラー発生
    • クライアント機器のネットワーク環境が遅いため、タイムアウトが発生
    -13ERROR_NETWORK_WRITEネットワークデータの転送中にエラー発生
    • クライアント機器のネットワーク環境が遅いため、タイムアウトが発生
    -14ERROR_NETWORK_NACK音声認識サーバでエラー発生
    • クライアント機器のネットワーク環境が遅いため、音声パケットをサーバに時間内に送信できず、タイムアウトが発生
    -15ERROR_INVALID_PACKET無効なパケットの転送によりエラー発生
    -20ERROR_AUDIO_INITIALIZEオーディオリソースのリセット中にエラー発生
    • オーディオ使用権限があるかどうか確認が必要
    -21ERROR_AUDIO_FINALIZEオーディオリソースの解除中にエラー発生
    -22ERROR_AUDIO_RECORD音声入力(録音)中にエラー発生
    • オーディオ使用権限があるかどうか確認が必要
    -30ERROR_SECURITY認証権限エラー
    -40ERROR_INVALID_RESULT認識結果エラー
    -41ERROR_TIMEOUT一定時間以上、サーバに音声を送信できなかったか、認識結果を受け取れない
    -42ERROR_NO_CLIENT_RUNNINGクライアントが音声認識を行わない状況で、特定の音声認識関連イベントを検知
    -50ERROR_UNKNOWN_EVENTクライアント内部で規定されていないイベントを検知
    -60ERROR_VERSIONプロトコルバージョンエラー
    -61ERROR_CLIENTINFOクライアント情報エラー
    -62ERROR_SERVER_POOL音声認識用可用サーバが不足している
    -63ERROR_SESSION_EXPIRED音声認識サーバのセッション期限切れ
    -64ERROR_SPEECH_SIZE_EXCEEDED音声パケットサイズ超過
    -65ERROR_EXCEED_TIME_LIMIT認証用タイムスタンプでエラー発生
    -66ERROR_WRONG_SERVICE_TYPE無効なサービスタイプ(Service Type)
    -67ERROR_WRONG_LANGUAGE_TYPE無効な言語タイプ(Language Type)
    -70ERROR_OPENAPI_AUTHOpen API認証時にエラーが発生
    • Client IDと登録された Package名(Android)または Bundle ID情報(iOS)に誤りがある
    -71ERROR_QUOTA_OVERFLOW定められた API呼び出し量制限(Quota)に到達
    • その他のエラーと問い合わせ
    現象または問い合わせ原因または解決方法
    UnsatifiedLinkErrorエラーが発生
    • CSR APIは、armeabiと armeabi-v7aでビルドされたライブラリを提供
    • 開発中のアプリで使用するライブラリのうち、armeabiと armeabi-v7aをサポートしていないものがある場合、このエラーが発生することがある
    android fatal signal 11 (sigsegv)エラーが発生
    • CSR APIを使用して音声の入力を受ける前にリソースの準備が必要
    • recognize()を呼び出す前にinitialize()release()が正常に呼び出されるのか確認
    認識結果として""(null)が返される
    • ユーザーが非常に小さな声で発声したか、周囲の音で声が認識されなかった場合に発生することがある
    • ごく稀に発生するが、認識結果が null(空の値)の場合も例外処理することがお勧め
    オーディオファイルを認識CSR APIはオーディオファイル認識をサポートしない
    低スペックのスマートフォンでは正常に動作しないAndroid SDKバージョンは10以降、iOSバージョンは8以降の機器をサポート
    参考

    NAVERクラウドプラットフォームで共通して使用されるレスポンスステータスコードの詳細は、Ncloud APIのレスポンスステータスコードをご参照ください。

    CLOVA Speech Recognition API

    CLOVA Speech Recognitionサービスで提供する APIの説明は次の通りです。

    API説明
    STT (Speech-to-Text)音声テキストを抽出
    Mobile SDKモバイル環境で音声テキストを抽出

    CLOVA Speech Recognition関連リソース

    CLOVA Speech Recognition APIについてユーザーの理解に役立つよう、さまざまな関連リソースを提供しています。


    この記事は役に立ちましたか?

    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.