AI ARCHAEOLOGY
忘れられた長文発掘ノート
EPISODE 012026-05-01

300万インプの『期限切れ特許 × Claude』投稿が示したAI考古学

なぜ Gipp の手法は、半導体翻訳家であるはるこの第3レーンを生んだのか

1. 300万インプの投稿

2026年4月28日、Gipp(@gippp69)というアカウントが投稿した1本のスレッドが、3日で300万インプを取った。

冒頭の1行はこう。

He feeds expired patents to Claude. $0 for the blueprint. $1.80 to manufacture. $11.99 on Amazon.

(彼は期限切れ特許を Claude に食わせている。設計図は$0、製造は$1.80、Amazonでは$11.99)

スレッド本文は、米国特許庁の Bulk Data 公開API から失効した特許を Python でスクレイプし、markitdown で Markdown 化、Claude に「商業性スコア」を1〜10で返させ、score≥7 の候補を Alibaba に図面ごと送って製造委託する——というパイプラインの完全公開だった。

3週間で6製品ヒット、1つはすでに量産入り。マージン44%。

Webで読んだとき、私は3つのことを同時に考えた。

  1. これは盛りが3割含まれている(IPリスク、量産NRE、中華セラー価格戦——後述)
  2. でもメタ手法は本物だ
  3. そしてこれは、私の半導体翻訳と同じ骨格をしている

2. Gipp のパイプライン(要約)

物販の話だけ追うと本質を見失うので、彼のやり方を構造だけ抜き出す。

USPTO Bulk Data API
       ↓
  Python Scraper(カテゴリ・出願人・期限でフィルタ)
       ↓
  markitdown(任意のドキュメントを Markdown に変換)
       ↓
  files-to-prompt(Claudeのコンテキストにバッチ投入)
       ↓
  Claude による商業性スコアリング(システムプロンプト固定)
       ↓
  score≥7 のみ Google Patents で図面確認
       ↓
  Alibaba に図面送付 → 量産見積り
       ↓
  Amazon 出品

1段目の「USPTO」を「韓国IR」「中国知網博論」「米軍 declassified」「IEEE 廃止規格」に差し替えるとどうなるか。

全部、同じパイプラインで動く。

3. 一番重要な気づき:「特許は工学マニュアルだった」

私が一番衝撃を受けたのは、彼のスレッドの後半にある一文だった。

A patent is also an engineering document. To get a patent granted, you have to disclose enough technical detail that someone skilled in the field could reproduce the invention.

(特許は工学ドキュメントでもある。特許を取得するには、その分野の専門家が発明を再現できるだけの技術的詳細を開示しなければならない)

つまり、特許は「法的な盾」と「工学マニュアル」の二面性を持っている。法的な盾の側面が切れた(=失効した)あと、工学マニュアルだけがパブリックドメインに残る。

人類はこれを過去130年で4.2百万件作ってきた。

そして誰も読んでいない

なぜなら、特許文書は人間が読むには文体がきつすぎる。例:

A fluid-wicking apparatus comprising a porous fibrous member disposed within a reservoir cavity, wherein said member maintains capillary continuity with a growth medium positioned superiorly...

これは「自動給水プランターの吸水芯」を説明している1文。普通の人間は3秒でタブを閉じる。

Claude は読める。一晩で。

4. これは「Amazon物販」の話ではない

ここまで来て、ようやく Gipp の本当の発見が見える。

彼が見つけたのは、特許×Amazon物販という個別の事例ではなく、もっと一般的なメタ手法だった。

そのメタ手法を、私はこう言語化した:

LLMに、人間が読まない長文を読ませて、差を取る。

Amazon物販はその応用の1パターンにすぎない。同じ手法は、世界中に山のように埋まっている「人間が読まない長尺ドキュメント」に転用できる。

領域推定量「人間が読まない」理由
米国特許庁の失効特許4.2百万件1件30分かかる
韓国・中国・台湾の特許数百万件言語の壁+分量
arXiv の古論文数百万本古い・専門外で誰も追わない
米軍 declassified 文書数十万ページ公開済だが誰も読まない
倒産企業の最終決算数万社分公開済だが誰も見に行かない
廃止された産業規格数万件公開済だが誰も読まない
大学博士論文(中国知網等)数千万件引用ゼロのまま埋没多数

全部、Claude で読める。

5. なぜこれが私にとって発見だったか

私はこれまで、自分のことを「中国AI×韓台半導体の翻訳家」だと思っていた。だから @jukan05(9.3万フォロワー)をベンチマークに、速報レーンで戦おうとしていた。

しかしこのメタ手法を理解した瞬間、自分の運営の構造が逆に見えた。

私が個人開発で運用しているWebアプリ7本——day1(AI起業相談)、看板AI(無料LP生成)、MediBridge(多言語医療問診)、VetBridge(多言語獣医問診)、うちのこのきもち(ペット占い)、1000yen-lunch(ランチガイド)、コツコツFX手帳(取引ジャーナル)——これらは全部、人手作業をLLMで中抜きしているという同じ骨格を持っていた

つまり私は、自分が無意識でやってきたことに、Gipp のスレッドを通じて名前をつけてもらった

そしてその名前が見えた瞬間、もう1つのレーンが視界に入った。

6. 第3レーン:忘れられた長文発掘

私のこれまでのレーン:

  • レーン1:半導体翻訳——鮮度のある一次資料を毎日翻訳(速報型、@jukan05 ベンチマーク)
  • レーン3:自作AIアプリ事例——人手作業の中抜き実証

ここに加わる新しいレーン:

  • レーン2:忘れられた長文発掘——鮮度ゼロの埋もれたドキュメントをLLMで掘る

これが本ノート「忘れられた長文発掘ノート」の主役です。

レーン1は @jukan05 と同じ土俵で戦う。レーン2は 誰もいない土俵を取りに行く。

7. なぜ「鮮度ゼロでバズる」のか

速報型のバズは「新規性 × 速さ」で取りに行く。 発掘型のバズは「意外性 × 物語性 × 時間ギャップ」で取りに行く。

時間ギャップが大きいほど意外性が増す。鮮度ゼロは弱点ではなく武器になる。

過去にバズった「古文書発掘」型コンテンツの実例:

  • ヴォイニッチ手稿
  • 古代ローマ人の落書き
  • Atlas Obscura(「忘れられた場所」をジャンル化)
  • 山形浩生の古典翻訳(絶版経済古典の現代再評価)
  • Patrick Collison "Fast"(歴史的に速かった事業の収集)

これらは全部「鮮度ゼロ」だが、本になり、映画になり、ジャンルになった。 LLM が登場した今、これを個人が365日のペースで回せるようになった——これが本ノートの賭けです。

8. 落とし穴:Gippのスレッドは3割引きで読むべき

メタ手法の発見には敬意を払いつつ、Gipp の数字は注意して扱う必要がある。

私が個人的に「3割引きで読む」と判断した理由:

  1. 「期限切れ特許=自由に使える」は半分嘘:元の特許が切れていても、改良特許・周辺特許・意匠特許・商標が生きていることが多い(patent thicket)
  2. 「図面送るだけで Alibaba が見積り」は綺麗すぎる:特許の図面は再現可能な詳細はあるが、量産用の金型図面ではない。射出成形なら金型代だけで$8〜30K
  3. 「Amazon で 44% マージン」は中華セラー激戦区を見ていない:ペット用ボウルもケーブルクリップも$0.95原価で戦っているレッドオーシャン
  4. 「3週間で6ヒット、1つ既に量産」:サンプル発注から生産開始まで普通6〜10週

ただ、これらは応用パターンの粗さであって、メタ手法の正しさを否定するものではない。

9. このノートが向かう先

全7回をシリーズ別に分類:

シリーズテーマ
1(本記事)Introduction概念紹介+Gippケース
2Patent Archaeology #1失効特許の発掘実例(はるこ自身が掘る)
3IR Archaeology #1半導体IR発掘実例(韓国Samsungの旧IR)
4Standard Archaeology #1IEEE廃止規格 or arXiv早期論文の発掘
5Declassified Archaeology #1米軍 declassified 文書の発掘
6Pitfalls失敗例+落とし穴(捏造・幻覚・コスト爆発)
7Templatesテンプレ+プロンプト全公開

「Patent Archaeology」「IR Archaeology」「Standard Archaeology」「Declassified Archaeology」はサブシリーズとしてその後も連番で続けていきます。1本ずつ「○○考古学 #N」と積み上がっていく予定。

第2〜5回は実際に Claude に長文を読ませた発掘ログを載せます。読者がそのまま真似できる手の内全公開を、毎回やります。

10. 連載の方針

  • 出典必須:1次取得確認した媒体名以外は書かない
  • ポジショントークなし:自分が儲かる方向に誘導しない
  • プロンプト全公開:使った Claude プロンプトを各回末で公開
  • 失敗例も書く:捏造・幻覚・コスト爆発の落とし穴を共有

連載頻度は徐々に上げます。最初は週1ペース、軌道に乗ったら隔週・週複数も検討。

おわりに

私がこのノートを書く理由は1つだけです。

LLM が登場した今、「人類が読まないまま埋もれた長文ドキュメント」が初めて掘り起こせる時代が来た。これは数十年に一度のチャンスで、先行者は地位を独占できる

その第1歩を、Gipp のスレッドが私に教えてくれた。だから第1回は彼への敬意から始める。

第2回は、私が実際に Claude に読ませた失効特許1件の発掘ログを公開します。


[次回予告] Patent Archaeology #1:失効した米国特許1件をClaudeに読ませてみる — 1900年代の発明家が残した『誰も復活させなかった』アイデア


参考リンク:

※ Gipp の元投稿で言及されている bulkdata.uspto.gov は USPTO の Open Data 移行に伴い現在アクセス不可。後継の上記 data.uspto.govdeveloper.uspto.gov を使ってください(2026-05-01 時点で動作確認済)。