📌 機能説明
このAPIは指定されたURLに対応するドキュメントの解析に使用され、OCR認識、数式/表の抽出、多形式エクスポートなどの機能をサポートします。コールバック通知または定期的なポーリングによって解析結果を取得でき、多種類のドキュメントの構造化解析シナリオに適用されます。HTMLファイルの解析には、必ずmodel_versionを"MinerU-HTML"に指定する必要があります。非HTMLファイルの場合は、ニーズに応じてpipelineまたはvlmバージョンを選択できます。
単一ファイルのサイズは200MBを超えてはならず、ファイルのページ数は600ページを超えてはなりません。
ネットワーク制限により、GitHub、AWSなどの海外URLへのリクエストはタイムアウトする可能性があります。
このAPIはファイルの直接アップロードをサポートしていません。
1.
このAPIで基本パラメータを設定した後、リクエストを送信してtask_idを取得します。
必須パラメータの検証:urlとmodel_versionは必須パラメータであり、不足するとAPI呼び出しが失敗します。callbackを使用する場合は、必ずseedパラメータを併せて提供する必要があります。
ページ範囲の形式:単一ページ番号、連続したページ区間(例:4-6)、逆から数えたページ(例:-2は最後から2番目のページを意味)をサポートし、複数のルールはコンマで区切ります。
エクスポート形式の説明:デフォルトではmarkdownおよびjson形式でエクスポートされます。追加のエクスポート形式はdocx、html、latexのいずれか1つまたは複数をサポートし、extra_formats配列で指定します。
💰 価格
期間限定で無料です。毎日のクォータには上限があり、使い切ると利用できなくなります。 Request
Body Params application/json
{
"url": "https://cdn-mineru.openxlab.org.cn/demo/example.pdf",
"model_version": "vlm"
}
Request Code Samples
curl --location --request POST 'https://api.302.ai/mineru/api/v4/extract/task' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{
"url": "https://cdn-mineru.openxlab.org.cn/demo/example.pdf",
"model_version": "vlm"
}'
Responses
application/json {
"code": 0,
"msg": "ok",
"trace_id": "79dd6fcac0f4b7e0a21fcc56854329a2",
"data": {
"task_id": "a4379d13-95e2-4af1-aae4-04fe5d6fc4cf"
}
}
Modified at 2026-01-23 02:55:23