★ Office 365 / Google Workspace 双方向対応

Excel・Word・PowerPoint を、
AI が読める Markdown へ。

社内に眠る数万のオフィスドキュメントを、構造を保ったまま Markdown へ自動変換。RAG / 社内ナレッジベース / LLM パイプラインのデータ前処理を、ノーコードで一気に解決します。

14 日間無料トライアル ・ クレジットカード不要 ・ 100 ファイルまで

AI 活用を進める企業に、データ前処理の標準として採用されています

ALPHA
NOVA
CASCADE
PRISM
HORIZON
NEXUS
AXIOM
VECTOR
ATLAS
ORBIT
KAIROS
STELLA
Why DOC-FUTURE

なぜ Markdown 変換が、AI 活用の鍵なのか

LLM・RAG が真価を発揮するには、構造化された軽量テキストが不可欠です。DOC-FUTURE は社内ドキュメントを「AI が読める形」に整える専門 SaaS。

01

構造を保った高精度変換

見出し階層・表・箇条書き・脚注・画像 OCR まで Markdown に正規化。RAG での検索精度・LLM の理解度が大きく向上します。

02

バッチで数万件、並列処理

S3 / Drive / Box / SharePoint と直結し、フォルダ単位で一括変換。差分検知・再変換・バージョン管理も自動化します。

03

RAG / LLM パイプラインに直結

チャンク分割・メタデータ付与・埋め込みベクトル生成までワンストップ。Pinecone / Weaviate / OpenSearch 等の主要 Vector DB に直接 Push。

SOC 2 Type II 取得済 ・ ISO 27001 準拠 ・ AWS PrivateLink / Azure Private Endpoint 対応
Features

AI 活用に必要なデータ前処理を、すべて 1 つに

変換・分割・メタデータ付与・連携・ガバナンス。LLM パイプラインの泥臭い部分を DOC-FUTURE が受け持ちます。

01

多形式対応 (Office 365 / PDF / 画像)

Excel (xlsx / xlsm) / Word (docx) / PowerPoint (pptx) / PDF / CSV / 画像 (PNG / JPG) まで網羅。レガシーな旧 Office 形式や Pages / Numbers / Keynote にも順次対応。

  • Office 365 ファイル全種
  • スキャン PDF + OCR (日英中対応)
  • 画像 (PNG / JPG / HEIC)
  • CSV / TSV / JSON
サポート形式の一覧
02

構造保持変換エンジン

見出し階層・表のセル結合・脚注・コメント・トラックチェンジまで Markdown 上で再現。複雑な Excel ピボットや Word の目次構造も再構成します。

  • 見出し階層 / リストの正規化
  • セル結合・複数シートの表現
  • 画像キャプション / 図表番号
変換サンプルを見る
03

RAG 最適化 (チャンク + メタデータ)

LLM のコンテキストサイズに合わせた最適チャンク分割 + ドキュメント単位 / 章単位のメタデータ付与。Vector DB への投入が CSV 1 つで完結します。

  • recursive / sentence / semantic 分割
  • OpenAI / Cohere / Voyage 埋め込み生成
  • Pinecone / Weaviate / pgvector へ直接 push
RAG 連携ガイド
04

バッチ処理とソース連携

S3 / Google Drive / Box / SharePoint Online / Dropbox / Azure Blob と直結し、フォルダ単位で一括変換。差分検知 / 再変換 / Webhook 通知をフルサポート。

  • 10+ のクラウドストレージ連携
  • 差分検知 + 自動再変換
  • CI/CD パイプライン (GitHub Actions) 連携
連携先一覧
05

API & CLI / セキュリティ

REST / Webhook / CLI を完備し、自社システムや MLOps に組み込み可能。VPC / PrivateLink / 顧客 KMS 鍵対応で機密文書も安心。

  • REST / Webhook / CLI
  • PrivateLink / Private Endpoint
  • 顧客管理 KMS / 監査ログ
セキュリティポリシー
How it works

3 ステップで、ドキュメントが AI の燃料に変わる

アップロードまたはストレージ連携を設定するだけ。後は DOC-FUTURE が変換し、LLM パイプラインに流し込みます。

1

取り込み

ドラッグ&ドロップ / S3 / Drive / SharePoint からファイルを取り込みます。

2

変換

構造を保ったまま Markdown へ。OCR・チャンク分割・メタデータ付与までワンパスで実行。

3

連携

Vector DB へ直接 push、または Markdown ファイルとして S3 / Git に出力します。

Pricing

使う分だけ、シンプルな料金

スモールスタートからエンタープライズの自社ホスティングまで対応します。

INDIE

個人 / 小規模チーム向け

¥4,800 / 月 (税抜)
  • 月 500 ファイルまで
  • 基本変換 (Office / PDF)
  • OCR (5,000 ページ / 月)
  • API / Webhook
  • Vector DB 直接 push
  • PrivateLink / 顧客管理 KMS
無料で試す

ENTERPRISE

大規模 / 統制重視

お問い合わせ
  • ファイル数 無制限
  • カスタム抽出ルール
  • 専用 OCR モデル / 多言語
  • API / Webhook / CLI / SDK
  • Vector DB / S3 / Git 連携
  • PrivateLink / 顧客管理 KMS / 監査ログ
相談する
FAQ

よくある質問

どのくらいの変換精度が出ますか?
構造保持率は標準フォーマットの Office 365 ファイルで 98% 以上です。複雑なレイアウト (画像内テキスト、複雑なセル結合等) には専用 OCR / カスタム抽出ルールでチューニング可能です。実ドキュメントでの精度評価レポートを無料で実施します。
機密文書を扱えますか?
はい、エンタープライズプランで AWS PrivateLink / Azure Private Endpoint / 顧客管理 KMS をサポートしており、データはお客様の VPC を出ずに変換できます。SOC 2 Type II / ISO 27001 認証取得済みです。
どんな Vector DB に対応していますか?
Pinecone / Weaviate / Qdrant / Milvus / pgvector / OpenSearch / Elasticsearch に標準対応。それ以外は API / Webhook 経由で任意のシステムに送信可能です。
埋め込みモデルは選べますか?
OpenAI / Cohere / Voyage / Google Vertex / Azure OpenAI / 自社ホスト モデル (BGE / E5 等) から選択可能。チャンクサイズ / オーバーラップもプロジェクト単位で設定できます。
チャンク分割の方法は?
recursive / sentence / semantic / character の 4 種類から選択可能で、ドキュメント種別ごとに自動で最適戦略を提案します。マニュアルなら章単位、契約書ならクローズ単位など、ドメインに合わせた最適化も可能です。
CI/CD パイプラインに組み込めますか?
GitHub Actions / GitLab CI / Jenkins から CLI でバッチ実行可能です。差分検知して新規・更新ドキュメントだけ再変換し、Vector DB を最新状態に保つ仕組みを標準提供しています。

いますぐ DOC-FUTURE で、AI 活用の地図を広げましょう。

14 日間無料 ・ 100 ファイルまで処理可能 ・ クレジットカード不要

POC 期間中は専任エンジニアが連携・チューニングを伴走サポートします。