Papago Doc Translation の概要
- 印刷する
- PDF
Papago Doc Translation の概要
- 印刷する
- PDF
Article Summary
Share feedback
Thanks for sharing your feedback!
概要
- ファイル内にソース言語で作成されたテキストをターゲット言語に翻訳する API
- 非同期形式の APIで、翻訳リクエスト(translate)/状態確認(status)/ダウンロード(download)の3つの APIで構成
- 翻訳サポート言語ペア: 韓国語↔英語、韓国語↔日本語、 韓国語↔中国語(簡体字)
- 文書1個基準- ファイル容量は100MBまで、文字数は30万まで
- サポートファイルフォーマット: MS office(docx、pptx、xlsx)、PDF、ハングル(HWP)
- HWPの場合、ハンコムオフィス2002から使用される HWP 5.0以上のバージョンにのみ対応
使用時の注意事項
- 画像のテキストは翻訳されません。
- テキストに適用されたスタイルは、一部一致しなかったり漏れることがあります。
- テキストに適用されたリンクまたはアクションも、一部動作しなかったり漏れることがあります。
- パスワードが設定されたファイルには対応していません。
- 読み取り専用ファイルには対応していません。
- HWPの場合
- ハンコムオフィス2002から使用される HWP 5.0以上のバージョンに対応しています。
- リリース用ファイルには対応していません。
- ハンコムオフィスで作成されていない HWPファイルには対応していません(ex. 拡張子だけ変更したファイル)。
- 翻訳により文章が長くなると、テキストが重なる現象が発生することがあります。テキスト領域を増やすと正常に確認できます。
- PDFの場合
- PDFファイルのレイアウト、段落間隔、デザインフォーム、カスタムフォント、および画像サイズなどが品質に影響を与えることがあります。可能であれば、視覚的要素が少ない文書の使用をお勧めします。
- 最適な結果が得られるよう、デフォルトの PDFファイルの使用をお勧めします。スキャンした文書を翻訳する場合、スキャン品質が翻訳結果に影響を及ぼす可能性があるため、原文の方向通りにスキャンする必要があります。
- 翻訳ファイルの容量は、原文より大きくなる場合があります。
- PDFファイルに比べて docxおよび pptxファイルの文書レイアウト、およびスタイルの維持がより良くなります。より良い結果を得るため、変換前のファイル形式で使用することをお勧めします。
- 2つ以上の言語を含む文書は、最初の言語の設定により翻訳結果が異なる場合があります。
共通設定
クライアント IDは、NAVERクラウドプラットフォームコンソールでアプリケーションを登録すると発行されます。
コンソールの AI Services > Papago Translation > APIs でアプリケーションを登録します。
AI Services > Papago Translation > APIs で登録したアプリケーションを選択し、Client IDと Client Secretの値を確認します。
AI Services > Papago Translation > APIs の修正 画面で Papago Doc Translation が選択されているか確認します。選択されていないと429(Quota Exceed)が発生するため、ご注意ください。
エラーコード
{
"error": {
"errorCode": "300",
"message": "Not Found Exception"
}
}
共通エラー
HTTP Status Code | Error Code | Error Message | Description |
---|---|---|---|
400 | 100 | Bad Request Exception | protocol(https)、encoding(UTF-8)などの requestエラー |
401 | 200 | Authentication Failed | 認証失敗 |
401 | 210 | Permission Denied | 権限なし |
404 | 300 | Not Found Exception | 権限なし |
429 | 400 | Quota Exceeded | Quota超過 |
429 | 410 | Throttle Limited | Rate超過 |
429 | 420 | Rate Limited | Rate超過 |
413 | 430 | Request Entity Too Large | content-length超過(100MB) |
503 | 500 | Endpoint Error | エンドポイント接続エラー |
504 | 510 | Endpoint Timeout | エンドポイント接続時間超過 |
500 | 900 | Unexpected Error | 例外処理がされていないエラー |
{
"error": {
"errorCode": "00001",
"message": "Request is invalid."
}
}
APIのエラー
HTTP Status Code | Error Code | Error Message | Description |
---|---|---|---|
500 | 00000 | API call failed | システム内部エラー |
400 | 00001 | Request is invalid | 誤ったパラメータが存在 |
- Papago Doc Translation APIは、ハンコムの HWP公開文書を参照して開発しました。
Pythonベースのサンプルコード
Python example (Status API)
import requests
headers = {
"X-NCP-APIGW-API-KEY-ID": ユーザー_クライアント_ID,
"X-NCP-APIGW-API-KEY": ユーザー_クライアント_シークレット
}
url = "https://naveropenapi.apigw.ntruss.com/doc-trans/v1/status?requestId=" + RequestId
res = requests.get(url, headers=headers)
print(res.text)
Python example (Translate API)
import requests
from requests_toolbelt import MultipartEncoder
import uuid
data = {
'source': 'ko',
'target': 'en',
'file': ('a.docx', open('a.docx', 'rb'), 'application/octet-stream', {'Content-Transfer-Encoding': 'binary'})
}
m = MultipartEncoder(data, boundary=uuid.uuid4())
headers = {
"Content-Type": m.content_type,
"X-NCP-APIGW-API-KEY-ID": ユーザー_クライアント_ID,
"X-NCP-APIGW-API-KEY": ユーザー_クライアント_シークレット
}
url = "https://naveropenapi.apigw.ntruss.com/doc-trans/v1/translate"
res = requests.post(url, headers=headers, data=m.to_string())
print(res.text)
Python example (Download API)
import urllib.request
url = "https://naveropenapi.apigw.ntruss.com/doc-trans/v1/download?requestId=" + RequestId
opener = urllib.request.build_opener()
opener.addheaders = [('X-NCP-APIGW-API-KEY-ID', ユーザー_クライアント_ID), ('X-NCP-APIGW-API-KEY', ユーザー_クライアント_シークレット)]
urllib.request.install_opener(opener)
urllib.request.urlretrieve(url, "b.docx")
この記事は役に立ちましたか?