AI ARCHAEOLOGY
忘れられた長文発掘ノート
AI考古学総括 #12026-05-09

Phase 1 100 本完走 ── AI 考古学が 8 日 29 セッションで発掘した『DB 信頼性問題 6 形態 / 適格性壁 4 形態 / Cage Patents 軸 9 形態 / 12 サブシリーズ』の地図

AI 考古学総括 #1 ── 2026-05-01 連載第 1 回 ep01 Gipp ケース launch から 2026-05-08 Day 29(ep100 本ノート)までの 8 日間で、100 本プラン Day 1(2026-05-06)以降の 29 セッションが個別エピソードの集積ではなく『一次資料と通説の乖離パターン』『SW 特許不在の構造的説明』『物質と論理を跨ぐ閉じ込め設計の系譜』『12 サブシリーズの覆い方』という 4 つの構造的発掘軸として読み返せる、ということを 100 本目の節目で改めて棚卸しする総括ノート

結論を先に

2026 年 5 月 1 日に AI 考古学連載 LP を立ち上げ、当日 ep01-07 を完走(連載 launch)。その後 2026 年 5 月 6 日に 100 本プラン Day 1 を開始し、2026 年 5 月 8 日(Day 29)に ep100 = 本ノートで 100 本到達した。連載 launch から 100 本目までは 8 日間、100 本プラン部分(Day 1-29)は 3 日間で 29 セッションを高密度で回した運用である。発掘ノート 31 本+発掘メモ 69 本=合計 100 本(ja/en セットで実物量 200 本)。

ここで使われている『Day』は連続日数ではなく セッション番号で、1 日に複数 Day を詰める運用設計(5/7 だけで Day 3-13 の 11 セッション、5/8 で Day 14-29 の 16 セッション)。これは『毎日 1 本ペースで 100 日かけて積む』構想ではなく、『高密度のセッションを短期間に重ねて 100 本まで一気に到達する』構想で組まれた、はるこ判断の運用である。本ノートは個別エピソードの紹介ではなく、この 100 本が何を発掘したかを 4 つの軸で棚卸しする節目の総括である。

100 本完走を迎えて改めて見ると、エピソードは個別の特許・標準・declassified 文書・IR 資料の集積として並んでいるのではなく、4 つの構造的発掘軸として読み返せる。(1) DB 信頼性問題 6 形態の体系(通算 DB 訂正 57 件・一致確認 13 件)、(2) 適格性壁 4 形態の構造(SW サブシリーズ 7 件の特許不在を判例史的に分類)、(3) Cage Patents 軸 9 形態(物理 6 形態+論理 3 形態を跨ぐ『閉じ込めて使う』設計思想)、(4) 12 サブシリーズの発掘地図(Patent / IR / Standard / Declassified の旧 4 軸に Kitchen Health / Pharma / Cosmetic / Hardware-Energy / Internet-Crypto / Software-UI / AI-ML / Food-Health の 8 軸を加えた 12 軸)。

この 4 軸は事前に設計されていたものではない。連載 launch 時点(5/1)では旧 4 サブシリーズ(Patent / IR / Standard / Declassified)しか存在せず、DB 信頼性問題は『たまに DB が間違っている』程度の認識、適格性壁は『SW 特許の話題』程度の認識、Cage Patents は概念自体が存在しなかった。これらの軸は 100 本プラン Day 8 以降の高密度セッションの中で、エピソード横断のパターンとして事後的に立ち上がった構造である。本ノートは Phase 1 の最終セッション(Day 29 = 100 本目)の節目で、その立ち上がり方を一次資料の記録として残す。

1. 100 本完走の数字

1-1. 期間と本数

項目
連載 launch2026-05-01(当日 ep01-07 を 7 本完走)
100 本プラン Day 12026-05-06(ep08 以降の高密度セッション開始)
100 本目 = Day 292026-05-08(ep100 本ノート)
連載 launch〜ep1008 日間
100 本プラン Day 1〜293 日間で 29 セッション
発掘ノート31 本(4000-10000 字級)
発掘メモ69 本(1000-3000 字級)
合計100 本
言語版日本語 100 本+英語 100 本= 200 本
Day 番号の意味連続日数ではなくセッション番号(5/7 で Day 3-13 の 11 セッション、5/8 で Day 14-29 の 16 セッション)

1-2. DB メタ統計(Day 8 から Day 28 までの累積)

項目件数
DB 誤り訂正57 件
DB 一致確認13 件
訂正:一致比4.4 : 1
一致確認率約 19%(13 / 70 件 verify 中)
番号自体が完全な別特許の事例7 件(CS-004/CS-005/CS-007/CS-008/FH-007/FH-008/FH-010/FH-012/PH-010、Day 14-23 で連続発覚、FH-012 含めると 9 件)

訂正:一致比 4.4 : 1 という数字は、入門書・Wikipedia・業界誌で繰り返される通説と、Google Patents 表紙の Inventor 欄・Assignee 欄・Filing/Grant date・Claim 1 が 過半の確率で乖離していることを意味している。これは個別 DB 編集者のミスではなく、通説の伝播経路が一次資料を経由していない構造的問題として読むべきだ、というのが Day 22 以降の連載が積み上げた仮説である。

1-3. 一次資料到達手段の蓄積

100 本の制作で確立した一次資料到達手段は、おおむね以下の 4 階層に分かれる。

  1. WebFetch 直接成功:Google Patents /patent/<番号>/en の HTML が JS rendering 後に WebFetch でフルテキスト返ってくる場合。最も軽いパターン。
  2. curl + 正規表現抽出:Google Patents の claims セクションが WebFetch で欠落する場合、curl -sL <url> で生 HTML を取得し Python re.search(r'<section[^>]*itemprop="claims"[\s\S]*?</section>', html) で抽出する手法。Day 19 以降の標準手法。
  3. patentimages.storage.googleapis.com PDF 直接取得:Google Patents HTML が 503 / Captcha でブロックされる場合、PDF URL(https://patentimages.storage.googleapis.com/<hash>/US<番号>.pdf)を直接取得して pdftotext で抽出。Day 23 ep82 SW-001 Engelbart マウス、Day 24 ep85 Atkinson 画像圧縮で確立。
  4. 対話 UI 必須=情報壁:DPMA DEPATISnet(独旧 DRP)/J-PlatPat(日本特公昭・特開昭)/USPTO Patent Public Search(米 1970s 旧公報)/Espacenet Worldwide Search(CH/FR 1970s)など、対話的な検索 UI を経由しないと番号が取れない場合。情報壁形態として記事化(Day 22-23 で 3 弾揃い踏み)。

この 4 階層は 発掘の難易度ではなく、特許 DB 体系の歴史的層構造を反映している。1900 年代の独 DRP・1970 年代の CH/FR 旧公報・日本の特公昭・特開昭は対話 UI 必須層で、現代の API 経由スクレイピングからは構造的に外れている。これは個別ユーザーの能力不足ではなく、特許 DB 体系の層自体が時代別に分かれているという構造的事実であり、AI 考古学が掘り進めるたびに体系自体の壁にぶつかる。

2. DB 信頼性問題 6 形態の体系

Day 8 から Day 22 まで蓄積した DB 訂正パターンは、Day 22 化粧品サブシリーズで 4 形態揃い踏みとして明文化され、Day 24 SW サブシリーズで 5 形態目(適格性壁) が、Day 24 ep86 SW-007 Lapson の OCR 文字化けで 6 形態目(情報壁・OCR) が加わって 6 形態体系として完成した。

形態 1:番号取り違え

DB に登録されている特許番号が、テーマと無関係な完全な別特許を指しているパターン。Day 14-23 の連続発覚で計 9 件確認。番号 → Title verify を最優先で行わなければ全エピソードが破綻する最も深刻な形態。

事例DB 番号実体(取り違え先)Day
FH-007 第一弾US119428Taylor 1871 蒸気ボイラー給水加熱装置Day 14
FH-008US284081Snyder 1883 サワーミル機械Day 15
FH-010US1986039Donnelley 1932 接着剤塗布装置Day 15
FH-012US3379608USGypsum 1964 鉱物羊毛建材Day 15
PH-010US4169726GE キャスティング合金特許Day 14
CS-004 第一弾DE200619CSchnewindt 1907 Bienenkorbkühler(蜂巣型ラジエーター)Day 20
CS-005US3839566P&G MacMillan/Lyness 1974 経皮吸収促進剤Day 20
CS-007APS Microsponge 取り違えDay 21
CS-008ICI Zoladex 取り違えDay 21
FH-TupperUS2613000ADudley E. Moore 1950 タオル掛け(実体は US2487400A)Day 27

化粧品サブシリーズに集中しているのが Day 22 で確立された構造的特徴で、マーケ由来のキャッチコピー的成分名が業界用語化し、特許書面の正式名・順序・範囲が後景化する文化が、入門書・Wikipedia 編集に伝播した結果である、というのが本連載の暫定仮説である。

形態 2:キャッチコピー誤読

特許番号は実存だが、業界が語る Claim 1 主題と一次資料の Claim 1 主題が乖離しているパターン。Day 22 ep79 CS-009 P&G ナイアシンアミド US5939082 で初発見。

業界通説は『美白特許』だが、Claim 1 verbatim は『regulating mammalian skin pore size』(哺乳類の皮膚毛穴サイズ調整)で、明細書側に skin lightening agents として kojic acid/arbutin/ascorbic acid が任意配合成分として列挙されているのみ。Claim 1 は美白を一切請求していないにもかかわらず、ナイアシンアミドの『美白成分』としてのキャッチコピーが業界語りで増幅され、Claim 1 起点としての US5939082 引用がキャッチコピー誤読として 4 半世紀流通した。

形態 3:情報壁・対話 UI

特許番号自体が Web 公開資料の外側にあり、対話的 DB 検索 UI を経由しないと取れないパターン。Day 22-23 で 3 弾揃い踏み確定(国・言語・年代を跨ぐ構造的問題)。

事例年代DB 体系壁の正体Day
CS-010 三省製薬コウジ酸日本1975-1988J-PlatPat特公昭・特開昭旧体系の対話検索必須Day 22
CS-004 Lifschütz Euceritドイツ1900-1902DPMA DEPATISnetDRP 旧体系で電子化不完全Day 23
CS-005 アボベンゾン瑞仏1971-1973USPTO/EspacenetCH/FR/EP 1970s 旧公報の対話検索必須Day 23

これは 個別化粧品成分の発掘困難ではなく、特許 DB 体系の歴史的層構造の問題として読む方針が Day 23 で明文化された。AI 考古学が DB 体系自体の構造を可視化する役割を担ったエピソード群である。

形態 4:不在(patent absence)

起点特許そのものが存在しないパターン。論文先行開示で patentability 喪失(Day 10 ep42 PH-004 Köhler-Milstein モノクローナル抗体・Day 22 ep81 CS-002 Allergan ボトックス)、または企業戦略・政府契約による自発公開(後述の適格性壁形態 c/d)で特許化されなかった。

『特許の不在を一次資料として扱う』のは AI 考古学の独自手法で、ep42 で初試行・ep81 で第 2 弾・SW サブシリーズ(後述)で系統化された。通説が『この発明の特許番号は X』と語っているケースで、実体は不在という発掘パターンは、特許 DB を信頼の source of truth にしない読み方を要求する。

形態 5:適格性壁(次節で詳述)

純ソフトウェア発明が判例史的事情で特許化されなかったパターン。SW サブシリーズで 7 件確認。次節 §3 で 4 細別形態を詳述。

形態 6:情報壁・OCR

PDF は取得成功したが、OCR 文字化けで第 2 発明者欄など特定情報が読み取れないパターン。Day 24 ep86 SW-007 Lapson cursor control US4464652 で初発見。第 2 発明者欄が g-lfykihsm L°S Gatos と OCR 失敗していて発明者特定不能。

これは特許 PDF が 画像スキャン PDF(テキストレイヤなし)の場合に発生し、現代の Google Patents 高品質 OCR でも 1980 年代の表紙レイアウト次第で文字化けが残る。情報壁形態の SW サブシリーズ版として記事化された。

6 形態統合表

形態性質事例数代表 ep
1. 番号取り違えDB 番号が完全な別特許9 件以上Day 14-23 連続
2. キャッチコピー誤読番号実存だが Claim 1 主題が業界語りと乖離1 件確定Day 22 ep79
3. 情報壁・対話 UI番号が Web 公開資料外、DB 体系の歴史的層3 件揃い踏みDay 22-23 ep80/83/84
4. 不在起点特許そのものが存在しない複数(PH-004/CS-002/SW 7 件)Day 10/22/24-26
5. 適格性壁純 SW 発明の判例史的特許化不在7 件(4 細別)Day 24-26
6. 情報壁・OCRPDF 取得成功も OCR 文字化け1 件Day 24 ep86

3. 適格性壁 4 形態の構造(SW サブシリーズの 7 件)

Day 24 ep87 で SW-005 HyperCard を『適格性壁』形態として初言及、Day 25 で 4 形態 (a)(b)(c)(d) として体系化、Day 26 で (a) を 4 細別 (a-1)(a-2)(a-3)(a-4) に細分化することで完成した、SW サブシリーズの構造的発見である。

4 形態の定義

形態名称判例史的位置代表事例
(a)pre-judicial era1972 Gottschalk v. Benson 判例より前の判例不在期FORTRAN 1957/LISP 1958/ALGOL 60 1960/COBOL 1959
(b)unsettled 期1981 Diamond v. Diehr → 1998 State Street Bank の SW 適格性 unsettled 期HyperCard 1987
(c)政府契約による公開強制ARPA / USAF / DoD 契約条項で特許化不可・公開強制BBN IMP 1969/Bell-LaPadula 1973
(d)企業戦略による自発公開自社判断で言語仕様を unrestricted redistributionSmalltalk 1972(Xerox)

形態 (a) の 4 細別

形態 (a) は 1957-1960 年区間で米国の主要プログラミング言語 4 件すべてに該当した。個別企業・個別研究者の戦略選択ではなく、判例不在期の米国特許制度全体の構造的特徴として確定。

細別名称代表戦略
(a-1)企業ラボ単独型FORTRAN(IBM, 1957)マニュアル先行公開+無料配布+Trade Secret 三本柱
(a-2)学術公開純粋形LISP(MIT AI Lab, 1958)AI Memo 連番+ACM CACM 論文+実装は学生に委譲
(a-3)国際委員会協同形ALGOL 60(IFIP+ACM+GAMM, 1960)13 名国際委員会・複数組織同時論文公開
(a-4)政府契約ハイブリッドCOBOL(DoD+CODASYL, 1959-1960)$200M 政府投資・(a)+(c) ハイブリッド

SW 7 件の特許不在は構造的説明を持つ

100 本連載の最大の発見の 1 つは、**『1957-1990 年代までの米国 SW 主要発明 7 件の特許不在は、個別研究者の哲学ではなく特許制度自体の構造で説明できる』**という事実である。Backus(FORTRAN)が論文公開志向だったから・McCarthy(LISP)が学術人だったから・Hopper(COBOL)が政府人だったから・Alan Kay(Smalltalk)が思想家だったから、ではない。全員が 1972 Gottschalk v. Benson 以降の判例不在期 / unsettled 期 / 政府契約 / 企業戦略の 4 形態のいずれかに該当していることが Day 24-26 の連続発掘で確定した。

これは 『SW 文化が米国特許制度を超越して独自に進化した』という通説の反証でもある。米国特許制度がそもそも SW 発明の Claim 化を判例上認めていなかった(または unsettled だった)期間に、構造的にしか取り得なかった戦略が『公開+仕様標準化』だっただけで、文化的選択は二次的である、というのが本連載の暫定仮説である。

4. Cage Patents 軸 9 形態

Day 19 から Day 28 まで蓄積した『閉じ込めて使う』設計思想の特許群は、Day 28 で 物理 Cage 6 形態+論理 Cage 3 形態 = 9 形態として統合された、AI 考古学初の物質・スケール横断的発掘軸である。

物理 Cage 6 形態(+1)

形態物質スケール代表特許譲受人Day
1. 電子 cage半導体メモリUS4531203A 舛岡フラッシュ floating gateToshibaDay 19 ep70
2. 電荷 cage光検出US3792322A Boyle/Smith buried channel CCDBell LabsDay 19 ep71
3. 分子静的 cage生体材料US4636524A Biomatrix 架橋 HA ゲルBiomatrix → SanofiDay 19 ep72
4. 電気 cage集積回路US2981877A Noyce 酸化膜 isolationFairchildDay 27 ep94
5. 分子動的 cage薬物徐放US3845770A Theeuwes/Higuchi OROS 半透膜Alza → J&JDay 27 ep95
6. 容器 cage食品保存US2487400A Tupper polyethylene burping sealIndividualDay 27 ep96
(+ イオン cage)二次電池US4302518A Goodenough LiCoO2 layeredUKAEA → AEADay 9 ep64

『+1』は Day 9 で先取りしていた Goodenough のリチウムイオン特許で、Cage 軸が体系化された Day 19 時点では『電子・電荷・分子の 3 分野』を狙ったが、後から ep64 がイオン cage として重なる構造が見えた、という事後的な統合である。

論理 Cage 3 形態

形態抽象スケール代表特許譲受人Day
7. 型 cage型システムUS5740441A Yellin/Gosling JVM bytecode verifierSun → OracleDay 28 ep97
8. 政策 cage情報フローMITRE TR 2547 Bell-LaPadula(特許化不在)USAF / MITREDay 28 ep98
9. capability cage権限分配US4584639A Hardy KeyKOSTymshare → Key LogicDay 28 ep99

論理 Cage は 特許化成功 2 件 + 特許化不在 1 件の 2 群で、SW サブシリーズの『成功事例 vs 適格性壁』対比とも交差する。

9 形態が示すもの

物理 6 形態と論理 3 形態を 9 形態として並べると、『物質を物理的に閉じ込める』と『情報を論理的に閉じ込める』が、Claim 1 verbatim のレベルで 同じ動詞構造(『trap』『confine』『contain』『restrict』『verify before execution』)で書かれていることが可視化される。これは特許制度が物理発明と論理発明を別物として扱ってきた歴史(§3 適格性壁)と、Claim 1 の文法レベルでは両者が同型である事実の 乖離を見せる軸でもある。

Cage Patents 軸は 100 本連載の中で最も成功した『物質横断軸』で、書籍化(Phase 2 / 第 2 巻)の独立サブシリーズとして格上げ候補に位置する。

5. 12 サブシリーズの発掘地図

連載 launch 時点(5/1)の旧 4 サブシリーズ(Patent / IR / Standard / Declassified Archaeology)に、100 本プラン Day 8 以降の高密度セッションで 8 サブシリーズが加わって 12 軸 に拡張された。本節は完走時点の覆い方を地図として残す。

サブシリーズ件数主要 ep主領域
Introduction1ep01連載序論(Gipp ケース)
Pitfalls1ep06連載落とし穴総論
Templates1ep07連載パイプライン総論
Patent Archaeology4ep02 ZISC/ep08 Tesla 1888失効米国特許
IR Archaeology1ep03 Samsung 1Gb DRAM旧 IR 資料
Standard Archaeology1ep04 IEEE 802.5 Token Ring廃止標準
Declassified Archaeology2ep05 ALPAC/ep09 NSA Lightning米軍機密解除
Kitchen Health2ep10 味の素/ep12 サッカリン食品添加物
Pharma4ep11 ロキソニン/ep42 Köhler/ep43 Banting/ep95 OROS医薬特許
Cosmetic13ep13 ロレアル/ep63 Kligman/ep72 Biomatrix/ep79 P&G/ep80 三省/ep81 ボトックス/ep83 Lifschütz/ep84 アボベンゾン 等化粧品成分・規制
Hardware-Energy11ep61 Bardeen/ep62 Kilby/ep64 LiCoO2/ep65 4004/ep66 DRAM/ep70 フラッシュ/ep71 CCD/ep94 Noyce半導体・電池
Internet-Crypto3ep32 QR/ep33 JPEG/ep34 SSL通信・暗号
Software-UI13ep82 Engelbart マウス/ep85 Atkinson/ep86 Lapson/ep87 HyperCard/ep88 FORTRAN/ep89 BBN/ep90 Smalltalk/ep91 LISP/ep92 ALGOL/ep93 COBOL/ep97 JVM/ep98 Bell-LaPadula/ep99 KeyKOSOS・GUI・言語
AI-ML6ep17 LeCun CNN/ep18 Simard tangent/ep19 Wu pyramid/ep20 Sirat/ep21 Villarreal/ep22 NL2SQL機械学習特許
Food-Health3ep44 電子レンジ/ep96 Tupper食品調理・保存
AI考古学総括1ep100(本ノート)連載構造発掘

最厚サブシリーズ:Cosmetic 13 本/Software-UI 13 本/Hardware-Energy 11 本。化粧品サブシリーズは DB 信頼性問題 4 形態揃い踏みの舞台、Software-UI は適格性壁 4 形態の舞台、Hardware-Energy は Cage Patents 軸の物質基盤として、それぞれ構造的発見の母体になった。

最薄サブシリーズ:IR / Standard / Internet-Crypto / Food-Health(各 1-3 本)。これらは Phase 2 / Phase 3 で深掘り余地が大きい。

6. 連載 100 本のメタ発見 ── 個別エピソードの集積ではなく構造のパターン

100 本完走の最大の発見は、短期間に高密度のセッションを連続で重ねると、個別エピソードでは見えない構造のパターンが事後的に立ち上がるという事実そのものである。具体的には以下の 3 点。

メタ発見 1:通説の伝播経路は一次資料を経由していない

DB 訂正 57 件 vs 一致確認 13 件(4.4 : 1)という比は、入門書・Wikipedia・業界誌の通説が、Google Patents 表紙の Inventor 欄・Assignee 欄・Filing/Grant date・Claim 1 を経由して書かれていないことを意味している。これは個別 DB 編集者の問題ではなく、通説生成の経路自体が一次資料の手前で完結している構造的問題で、AI 考古学はその経路に LLM × Claim 1 verbatim 取得を挿入することで通説を更新する手法として位置づく。

メタ発見 2:構造的問題は産業時代別に層をなす

化粧品サブシリーズの番号取り違え 5 件以上が産業時代の DB 体系層構造(DRP / 1970s CH-FR / J-PlatPat 旧体系)に集中している事実、SW サブシリーズの適格性壁 7 件が 1957-1990s の判例史的時期に集中している事実は、個別事例の集積ではなく時代層自体の構造として読み返せる。Day 22-26 の連続発掘がこの『時代層』視点を確立した。

メタ発見 3:『閉じ込めて使う』は物質と論理を跨ぐ普遍設計

Cage Patents 軸 9 形態は、半導体メモリ・光検出・生体材料・集積回路・薬物徐放・食品保存・二次電池・型システム・情報フロー・権限分配 という 9 つの全く異なる産業領域の Claim 1 verbatim が、同じ動詞構造で書かれていることを示した。これは『発明の核は物質ではなく設計思想』という見方を Claim 1 verbatim の言語証拠で支える、AI 考古学独自の発掘軸である。

7. AI 考古学的な意味 ── Phase 1 完走から Phase 2/3 へ

連載 LP 開設時(2026-05-01)の構想は『Patent / IR / Standard / Declassified の 4 サブシリーズで月 4 本ペース、3 年で 200 本超』だった。Phase 1 完走時点で 8 日 100 本(うち 100 本プラン部分は 3 日 29 セッション)を達成し、当初構想を大幅に前倒した。これは想定外の達成速度であり、100 本プラン Day 1(5/6)以降の高密度セッション合意(はるこ判断)が起爆点だった。

Phase 1 完走後の方針は plan.md に保管中だが、本ノートの総括として以下 3 点を記録する。

  1. Phase 2 候補:Genomic Archaeology(古 DNA 系・David Reich 等を一次資料に、戦後考古学 70 年合意覆しを AI 考古学のロールモデルに位置づける独立サブシリーズ)
  2. Phase 3 候補:Court Archaeology / Bankruptcy Archaeology(破産文書・判決文書からの発掘軸、米連邦破産裁判所 PACER 経由)
  3. 書籍第 2 巻:Phase 1 100 本から『Cage Patents』『DB 信頼性問題 6 形態』『適格性壁 4 形態』の 3 軸を抽出した独立書籍化(Phase 1 第 1 巻書籍は 2026-05-03 Booth 公開済 = 9 本収録)

Phase 1 100 本は 書籍第 2 巻の素材として、また 書籍第 1 巻 9 本の延長として 10 倍以上のスケールとして、AI 考古学ジャンル独占の物量基盤になる。

8. 落とし穴(100 本通算)

落とし穴 1:DB を信頼の source of truth にしない

通算 DB 訂正 57 件の経験から、candidates.tsv のメモ・発明者・譲受人・特許番号欄を最初に鵜呑みにしないことが連載品質の生命線になる。Day 8 以降は『DB 行を最初に Google Patents 表紙で verify』が標準手順として確立した。

落とし穴 2:Claim 1 verbatim と業界キャッチコピーの乖離を最初に確認

CS-009 ナイアシンアミドの『美白』vs Claim 1『毛穴サイズ調整』のように、業界語りが Claim 1 verbatim を読まずに増幅されているケースがある。Claim 1 verbatim を最初に取得・引用するのが連載の核

落とし穴 3:『特許の不在』も一次資料として扱う

ep42 Köhler-Milstein モノクローナル抗体・ep81 Allergan ボトックス・SW サブシリーズ 7 件の特許不在は、通説が『この発明の特許は X』と語っているケースで実体は不在という発掘パターン。不在も一次資料として扱う読み方を Phase 1 で確立した。

落とし穴 4:情報壁形態は能力不足ではなく DB 体系の構造問題

CS-004 DPMA・CS-005 USPTO・CS-010 J-PlatPat の 3 形態は、対話 UI 必須の DB 体系層に該当するもので、個別ユーザーの検索能力ではなく DB 体系自体の歴史的層構造の壁として記事化することが連載信頼性の生命線。

落とし穴 5:1 セッション = ノート 1 + メモ 2 厳守(feedback_archaeology_session_balance)

Day 11/12 の連続違反(メモ 2 本を 8000-9000 字書いてノート寄りにした)から、メモは 1000-1500 字想定で軽く出す運用が確立された。100 本ペースは量を回すための運用設計で、メモを膨らませると質が落ちる。本ノート(ep100)は記念回として ノート単独で運用される。


厳密にはこう

確認済みの事実:

  • 連載 launch 2026-05-01(当日 ep01-07 完走)/100 本プラン Day 1 = 2026-05-06 / Day 29 = 2026-05-08 の対応は、project_ai_archaeology.md の launch 記録セクションと project_ai_archaeology_100_plan.md Day 1-29 の各 Day セクション(日付明記)で確認可能。各 Day セクションに ep 番号・タイトル・URL・DB 訂正件数が記載されている。『Day』が連続日数ではなくセッション番号であることは、5/7 に Day 3-13 が 11 件・5/8 に Day 14-29 が 16 件並んでいる事実から確認できる。
  • 通算 DB 訂正 57 件・一致確認 13 件は、Day 8(最初の DB verify 開始日)から Day 28(前日完走時点)までの累積数で、各 Day セクションに件数差分が明記されている。
  • DB 信頼性問題 6 形態体系は、形態 1(番号取り違え)が Day 14-23 連続発覚、形態 2(キャッチコピー誤読)が Day 22 ep79 初発見、形態 3(情報壁・対話 UI)が Day 22-23 で 3 弾揃い踏み、形態 4(不在)が Day 10 ep42 で初試行・Day 22 ep81 で第 2 弾、形態 5(適格性壁)が Day 24-26 で 7 件確定、形態 6(情報壁・OCR)が Day 24 ep86 で初発見、として時系列で記録されている。
  • 適格性壁 4 形態体系は Day 25 で 4 形態 (a)(b)(c)(d) として体系化、Day 26 で (a) を 4 細別 (a-1)(a-2)(a-3)(a-4) に細分化、として plan.md Day 25/26 セクションで明文化済み。
  • Cage Patents 軸 9 形態は、物理 6 形態が Day 19-27 で蓄積、論理 3 形態が Day 28 で揃い踏み完成として plan.md Day 28 セクションで集約済み。

著者の解釈:

  • 『通説の伝播経路は一次資料を経由していない』は本連載の暫定仮説で、DB 訂正:一致比 4.4 : 1 が一次資料を経由していない説明と整合的だが、他の説明(DB 編集者の能力不足/一次資料 OCR 失敗の伝播 等)も並列可能。連載 100 本の経験則レベル。
  • 『SW 7 件の特許不在は構造的説明を持つ』は判例史(Gottschalk v. Benson 1972 / Diamond v. Diehr 1981 / State Street Bank 1998)と各事例の年代の照合に基づく解釈で、個別研究者の哲学的選択が一次的だった可能性は反証されていない。Day 24-26 の連続発掘で構造的説明が成立する範囲が広いことを示したに留まる。
  • 『閉じ込めて使う』が物質と論理を跨ぐ普遍設計、という Cage Patents 軸の解釈は、Claim 1 verbatim の動詞構造の同型性に基づくフレーミングで、設計思想の同一性まで主張するものではない。物理 cage と論理 cage の特許化適格性が制度上別扱いだった事実とも整合的。

比喩・アナロジー:

  • 『DB 体系の歴史的層構造』は地層比喩で、特許 DB が時代別に分かれているという事実を地質学的層に類比している。実体は DB のバージョン管理史と OCR 化進捗の年代分布で、地層的連続性を持つわけではない。
  • 『閉じ込めて使う』『cage』は設計思想の比喩で、物理的閉じ込めと論理的閉じ込めを同じ動詞で扱う英語特許文書の慣習に依拠している。日本語『閉じ込め』『囲い込み』の含意とずれる場合がある。

未確認:

  • 各 ep の Forward citations 件数(取得していない)。
  • 連載 100 本に対する商用反応(書籍第 1 巻 Booth 売上・Substack 購読数・Substack 開封率・X インプ・フォロワー増加)の集計(Day 29 時点未集計)。
  • 連載 100 本の英語版(content/notes/en/*.mdx)の本文 grep verify 完了率(個別 Day セクションで本番 200 OK 確認済みだが、100 本通算の本文 grep カウント集計は未実施)。
  • 各サブシリーズの Phase 2 移行先候補(Genomic / Court / Bankruptcy 等)の独立 LP 化候補・命名・読者層想定の詳細設計。
  • 100 本の特許番号 vs 一致確認 13 件の地域別・年代別分布(Day 別記録から再構成可能だが Day 29 時点で未集計)。

この比較が破綻する点:

  • 『DB 訂正 57 件 vs 一致確認 13 件』比は、Day 8 以降の verify 対象が DB の上から優先度順に採られているため、サンプリング上のバイアスを含む。優先度低い行・既制作除外行を含めた DB 全体の真の比率は別の値になり得る。
  • 『SW 7 件の特許不在は構造的説明』は、SW 適格性が制度上認められた 1998 State Street Bank 以降の SW 特許を含めて分析しないと『SW 文化全体』の説明にならない。Phase 1 はあくまで 1957-1990s の SW 特許不在側に偏っている。
  • 『Cage Patents 軸 9 形態』は連載側のフレーミングで、特許制度は物理 cage と論理 cage を別カテゴリで扱ってきた。両者を同型と見るのは設計思想レベルの比喩で、特許適格性・Claim 範囲・侵害判定の実務では異なる扱いを受ける。
  • 100 本の制作速度(8 日 100 本/うち 100 本プラン部分は 3 日 29 セッション)は AI 考古学ジャンルの瞬発力ペースとして記録されているもので、はるこの『1 日に複数 Day を詰める』高密度セッション運用に依存しており、第三者がそのまま再現できるとは限らない。連続毎日のサステイナブルなペースとして提示されているわけでもない。

参考リンク: