AI ARCHAEOLOGY
忘れられた長文発掘ノート
THEME

はじめに・方法論

AI考古学とは何か。なぜやるか、どう書くか。落とし穴と総括まで。

4
  1. AI考古学総括 #1
    Phase 1 100 本完走 ── AI 考古学が 8 日 29 セッションで発掘した『DB 信頼性問題 6 形態 / 適格性壁 4 形態 / Cage Patents 軸 9 形態 / 12 サブシリーズ』の地図
    AI 考古学総括 #1 ── 2026-05-01 連載第 1 回 ep01 Gipp ケース launch から 2026-05-08 Day 29(ep100 本ノート)までの 8 日間で、100 本プラン Day 1(2026-05-06)以降の 29 セッションが個別エピソードの集積ではなく『一次資料と通説の乖離パターン』『SW 特許不在の構造的説明』『物質と論理を跨ぐ閉じ込め設計の系譜』『12 サブシリーズの覆い方』という 4 つの構造的発掘軸として読み返せる、ということを 100 本目の節目で改めて棚卸しする総括ノート
    2026-05-01 連載 launch の当日 ep01-07 完走から 2026-05-08 Day 29 = ep100 完走までの 8 日間で、AI 考古学連載は 100 本(発掘ノート 31 本+発掘メモ 69 本)に到達した。100 本プラン Day 1 は 2026-05-06 開始、Day 29 完走まで 3 日間で 29 セッションを高密度で回した運用である(『Day』は連続日数ではなくセッション番号、1 日に複数 Day を詰める方式)。本ノートは個別エピソードの紹介ではなく、4 つの軸でこの 100 本が何を発掘したかを棚卸しする総括ノートである。軸 1『DB 信頼性問題 6 形態』は Day 8 から積み上がった通算 57 件の DB 訂正と 13 件の一致確認を、(1) 番号取り違え(化粧品 5 件・食品健康 1 件など)/(2) キャッチコピー誤読(CS-009 P&G ナイアシンアミドの『美白』vs Claim 1『regulating mammalian skin pore size』乖離)/(3) 情報壁・対話 UI(CS-004 DPMA・CS-005 USPTO 1970s・CS-010 J-PlatPat の 3 弾揃い踏み)/(4) 不在(PH-004 Köhler-Milstein・CS-002 ボトックス・複数の SW 不在)/(5) 適格性壁(SW 7 件)/(6) 情報壁・OCR(SW-007 Lapson 第 2 発明者文字化け)の 6 形態に整理する。軸 2『適格性壁 4 形態』は Day 24-26 で確立した SW 特許不在の構造分類で、(a) pre-judicial era 4 細別(FORTRAN/LISP/ALGOL/COBOL)/(b) unsettled 期(HyperCard)/(c) 政府契約公開強制(BBN IMP・Bell-LaPadula)/(d) 企業戦略自発公開(Smalltalk)に分かれる。軸 3『Cage Patents 軸 9 形態』は Day 19-28 で蓄積した『閉じ込めて使う』設計思想の系譜で、物理 Cage 6 形態(電子・電荷・分子静的・電気・分子動的・容器・イオン)と論理 Cage 3 形態(型・政策・capability)を統合する。軸 4『12 サブシリーズ』は連載が覆った領域横断の地図で、Patent / IR / Standard / Declassified の旧 4 軸に Kitchen Health / Pharma / Cosmetic / Hardware-Energy / Internet-Crypto / Software-UI / AI-ML / Food-Health の 8 軸が加わって 12 サブシリーズに拡張された記録を残す。
  2. TEMPLATES
    全プロンプトとパイプライン全公開 — あなたが自分の領域で始めるための完全ガイド
    Templates — 第1〜5回で使った全武器を、再現可能な形で1ファイルにまとめる
    本連載の最終回。第1〜5回で実際に使った全プロンプト(候補選定・内容抽出・現代翻訳・答え合わせ・落とし穴チェック)と、完全なパイプライン図、ツールスタック、再現手順を1記事に集約。これを読んだあなたが、自分の領域で『忘れられた長文発掘』を今日から始められることを目指す。
  3. PITFALLS
    LLM中抜きの3大落とし穴 — 捏造・コスト爆発・誤読の実例集
    Pitfalls — 第1〜5回で実際にハマった失敗と、その対策プロンプト全公開
    LLMで人間が読まない長文を発掘するとき、ほぼ確実にハマる3つの落とし穴:捏造(架空の出典付け)/コスト爆発(503・モデル劣化・トークン爆発)/誤読(言語の壁、専門用語の罠)。本連載第1〜5回で実際に起きた事例を全部開示し、それぞれの対策プロンプトと運用ルールを示す。
  4. EPISODE 01
    300万インプの『期限切れ特許 × Claude』投稿が示したAI考古学
    なぜ Gipp の手法は、半導体翻訳家であるはるこの第3レーンを生んだのか
    @gippp69 の300万インプ投稿が露わにしたのは、Amazon物販ではなく『LLMに人間が読まない長文を読ませて差を取る』というメタ手法だった。これがはるこの3レーン目を発見させた。