1998年のAmazon特許に、「この商品を買った人は」の設計図が全部書いてあった
Patent Archaeology #2(ニコラ・テスラ US381968)では、1888年のモーター特許が現代EVの前史を丸ごと含んでいた話を書いた。
今回はもう少し身近な場所から掘る。ECサイトで「この商品を買った人はこちらも」と表示されるあの推薦枠の設計図が、1998年のAmazon特許に書かれている。
結論を先に
特許番号:US6266649B1 タイトル:「Collaborative recommendations using item-to-item similarity mappings」 出願:1998年9月18日 公開:2001年7月24日 発明者:Gregory D. Linden、Jennifer A. Jacobi、Eric A. Benson Original Assignee:Amazon.com Inc Current Assignee:Amazon Technologies Inc Google Patents上の状態:Expired - Lifetime(Anticipated expiration: 2018-09-18) クレーム数:49 訴訟ファミリー:あり
注意:Legal statusはGoogle Patents上の表示にとどまる。法的な自由利用の判断にはUSPTO Patent Centerでの確認が必要。
強いアナロジーと技術的同一性はここで分ける。
この特許は現代のAIレコメンドや埋め込み検索そのものではない。item-to-item協調フィルタリングとembeddingベクトル空間での近傍探索は、計算原理が根本的に異なる。ただし「類似を事前計算してリアルタイムに合成する」という設計上の問題意識は、現代の大規模推薦インフラが解こうとした課題と重なっている。
この特許の中心的な発想はシンプルだ。「ユーザーが増えるたびに全ユーザーの行動を比較する計算」をやめて、「商品と商品の類似関係を事前に全部計算しておき、推薦時はその表を引くだけにする」という設計への転換を、具体的な実装レベルで記述している。
1. どう選んだか
発掘候補DBのPatent Archaeology枠で「現代接続スコア5・面白さスコア5・一次資料確認済み」として最優先に上がっていた1件。AmazonのECレコメンドがどう設計されたかを示す一次資料がGoogle Patentsに残っており、アブストラクトと仕組みの概要を確認した。
今回の一次資料到達状況:Google Patentsのアブストラクトと機構説明を確認済み。Claim 1の逐語テキストはJavaScriptレンダリングの制約で取得できていない(未確認として記録)。
2. 特許の核心
Google Patentsのアブストラクトに書かれた仕組みを整理するとこうなる。
推薦サービスがユーザーの購買・閲覧履歴をもとに個別の推薦を生成する。事前に生成されたテーブルを使ってアイテムを「類似アイテムのリスト」にマッピングし、ユーザーの既知の関心アイテムから類似アイテムリストを取得・結合して推薦を作る。テーブルはオフラインプロセスで定期的に更新される。
技術的な核は3点に絞れる。
1. 商品ごとに「類似商品リスト」をオフラインで事前生成する 類似度はユーザー群の購買履歴・関心の共起(co-occurrence)から計算する。誰がどの商品を同時に買ったか、見たかの相関を集計する。
2. 重い計算はオフライン、推薦はリアルタイムに参照・合成するだけ ユーザー数が増えても推薦時の計算量が爆発しない設計。テーブルを引いて結合するだけなので、レイテンシが低い。
3. ユーザー間比較ではなくアイテム間比較 ユーザーが増えるたびに全ユーザーペアを比較する従来の「user-user」型協調フィルタリングと異なり、アイテム数は比較的安定しているためスケールしやすい。
3. 現代との翻訳表
| US6266649B1(1998年) | 現代の推薦システム | 評価 |
|---|---|---|
| item-to-item類似テーブルをオフライン生成 | バッチで作るitem embeddingインデックス | 類似(問題意識は共通、実装は異なる) |
| 購買履歴の共起から類似度計算 | 行動ログから学習する協調フィルタリング系統 | 類似 |
| テーブル参照・リスト結合でリアルタイム推薦 | ANNを使った低レイテンシ推薦 | 比喩(速さの問題意識が重なる、手法は別) |
| item-to-item mapping | embeddingベクトル空間での類似探索 | 無理がある(設計が根本的に異なる) |
3行目と4行目について補足する。「推薦時にオンラインで軽く返す」という方向性は現代も同じだが、手法は全く異なる。この特許のitem-to-itemテーブルは共起の集計から作る疎な構造体であり、dense vectorのベクトル空間とは設計が根本から違う。「同じ問題を解こうとした」「設計の問題意識が重なる」という表現が適切で、「技術的に継承された」とは言えない。
4. なぜ一般の技術語りでは参照されにくいか(推測)
2003年にLindenら自身がIEEE Internet Computingに解説論文を発表し、item-to-item collaborative filteringの考え方は技術者に広く知られるようになった。論文が普及したことで、特許文書そのものへの参照は相対的に少なくなったと推測される。
また、協調フィルタリングの先行研究(GroupLens 1994年、Resnick et al.)が学術的に整理されたことで、「Amazonが推薦を作った」という文脈より「協調フィルタリングの大規模実用化」という文脈で語られるようになった。
これは推測であり、社内文書・経営判断記録には今回到達していない。
5. AI考古学的な意味
ECサイトで「この商品を買った人は」を最初に見たとき、多くの人はUIとして記憶する。どのページに出た、どの会社が実装した、という形で。
特許文書は「どうUIを作るか」ではなく「どう推薦を生成するか」の設計判断を記述している。LLM登場以前は、49クレームの英語特許文書を個人が読み解くコストが高すぎた。今は要約・翻訳できる。
「なぜAmazonの推薦はあれほど当たるのか」を一次資料から確認する。それは感想ではなく、設計の文脈を知ることだ。その文脈を持っている人と持っていない人では、現代の推薦システムを読むときの解像度が違う。
6. 落とし穴
落とし穴1:「Amazonが推薦を発明した」と書かない
GroupLens(1994年)はすでにuser-user協調フィルタリングを実装していた。Amazonの貢献は「大規模ECでのitem-to-item方式の実用化と特許化」であり、推薦の発明ではない。
落とし穴2:item-to-itemとembedding推薦を同一視しない
現代の二段階推薦(retrieval + ranking)やtwo-tower modelは、この特許とは設計が根本的に異なる。「似たアイテムを探す」という課題の共通性はあるが、計算原理は別物。
落とし穴3:Legal statusだけで自由利用を断定しない
Google PatentsはExpired - Lifetimeと表示しているが、訴訟ファミリーが存在する。利用判断にはUSPTO Patent Centerでの確認が別途必要。
厳密にはこう
確認済みの事実 Google Patentsより:US6266649B1 / 出願1998-09-18 / 公開2001-07-24 / 発明者3名(Linden・Jacobi・Benson)/ Assignee Amazon Technologies Inc / Expired-Lifetime(anticipated 2018-09-18)/ クレーム49 / 訴訟ファミリーあり / アブストラクトおよび機構説明を確認
著者の解釈 「ECにおける大規模推薦の前史として読める」は著者の解釈。現代の推薦技術との技術的継承関係を示す一次資料は今回未確認。
比喩・アナロジー 対応表3行目(リアルタイム推薦の速さ)は問題意識が重なる比喩。4行目(item mapping vs embedding)は設計が根本的に異なるため「無理がある」と評価した。
未確認 Claim 1の逐語テキスト / 2003年IEEE論文との内容照合 / 訴訟ファミリーの最終判決 / Amazon本番実装との一致度 / GroupLens・UCB先行研究との技術的差分
この比較が破綻する点 現代のembeddingベクトル検索との対比は設計レベルで成立しない。「類似を扱う」という抽象レベルでのみ重なる対応付けであり、実装上の継承関係を示す根拠は今回の調査では確認できていない。
参考リンク:
- 元特許:US6266649B1 on Google Patents
- AI・機械学習特許 #2(次回):IBM統計的機械翻訳 US5477451A
- Patent Archaeology #1:IBM ZISC US5717832(1995年)
- Patent Archaeology #2:ニコラ・テスラ US381968(1888年)