ChatGPTにSQLを書かせる夢は、1989年の特許にあった──US5197005Aが立てた「自然言語でDBを検索する」という問い
発掘メモについて: このシリーズの「発掘メモ」は、一次資料URLを確認した段階で候補の概要を記録したものです。本文精読・Claim 1の逐語確認は未実施です。確認済み事実のみ記載し、推測は推測として明示しています。
なぜ掘るか
「ChatGPTにデータを聞けば、SQLを書いてくれる」という体験は2023年以降に一般化した。しかし「自然言語でデータベースを検索したい」という問いは1989年に既に特許として立てられていた。当時はルールベースの専門家システムで解こうとした。現代はLLMで解いている。同じ問いに30年以上の歳月を経て異なる解法が登場したことの意味を確認したい。
特許の基本情報
- 特許番号:US5197005A
- タイトル:Database retrieval system having a natural language interface
- 出願:1989年5月1日
- 成立:1993年3月23日
- 発明者:Steven Shwartz、Claudio Fratarcangeli、Richard E. Cullingford、Gregory S. Aimi、Donald P. Strasburger(5名)
- Original Assignee:Intelligent Business Systems
- 一次資料:Google Patents(URL確認済み・Abstract・技術内容取得済み)
- Legal status:Expired(Fee Related)
核心(Google Patents取得済み情報)
この特許が解こうとした問題は二つだ。
シノニム問題:ユーザーが「顧客」と言っても、DBのカラム名が「client」かもしれない。自然言語の語彙とDB設計者の語彙がずれる。
データ位置問題:「売上を教えて」と言っても、それがどのテーブルのどのカラムに存在するかをシステムが知らない。
特許の設計はこの二つを解決するための「知識ベース」を中心に置く。
データベース開発者は、検索対象となるアプリケーションデータベースの構造的および意味的記述を含む知識ベースを作成する。データベース独立で標準的な内部意味表現が生成され、専門家システムがこの表現に基づいて必要なデータベース要素を特定する。
設計の流れはこうだ:
- 開発者が知識ベースを作成(DBのスキーマ+意味的な記述)
- ユーザーが自然言語でクエリを入力
- システムが内部意味表現に変換(SQL等のDB言語に依存しない中間表現)
- 専門家システムが意味表現からDB要素を特定してクエリ実行
- デバッグ機能でクエリ解釈を人間が確認できる
特に「デバッグ機能で解釈を確認できる」という点は、現代のLLMエージェントが生成するSQLをユーザーが検証するUXとの問題意識の重なりとして読める。
現代との接続仮説
| US5197005A(1989年) | 現代の技術 | 評価(仮説段階) |
|---|---|---|
| 知識ベース(DBのスキーマ記述) | RAGのコンテキスト注入 / Schema-aware prompting | 類似(「DBの構造を事前に知らせる」という問題意識が重なる) |
| 内部意味表現(SQL独立の中間表現) | LLMが生成する内部的な意図解釈 | 比喩(「中間表現を経由する」という設計方向性が近い) |
| 専門家システムがDB要素を特定 | LLMがNL2SQLでSQLを生成 | 類似(「自然言語→DB操作」という問題意識は同じ、解法は根本的に異なる) |
| デバッグ機能でクエリ解釈を確認 | LLMのSQL出力をユーザーが検証するUX | 類似(「解釈の透明性」という問題意識が重なる) |
| ルールベースの解析 | LLMの確率的生成 | 無理がある(対応として強引。設計思想が根本的に異なる) |
最も重要な違い:この特許の専門家システムは、あらかじめ定義されたルールとDB知識ベースに基づいてクエリを変換する。現代のLLMは確率的な言語モデルとしてSQLを生成する。「自然言語でDBを検索する」という問いは同じだが、解法の設計思想が根本的に異なる。
これは一次資料の全文精読前の仮説。Claim 1詳細確認後に修正する。
未確認ポイント
- Claim 1の逐語テキスト
- 実際に製品化されたか(Intelligent Business Systemsの事業履歴)
- どんな商用DBを対象にしていたか(Oracle? dBASE?)
- Forward citations件数(NL2SQL研究への影響)
- 5名の発明者それぞれの専門分野
次アクション
Claim 1とIntelligent Business Systemsの事業履歴を確認する。製品化されていた場合、当時どんなユーザーに使われたかが記事のフックになる。
参考リンク:
- 元特許:US5197005A on Google Patents
- AI・機械学習特許 #3(発掘ノート):Philips バックプロパゲーションハードウェア US5517598A(1993年)
- AI・機械学習特許 発掘メモ #5:NASA 時空間ニューラルネット US5253329A(1991年)