Claude Fable 5: Yang Perlu Developer Ketahui

Foto oleh Google DeepMind

Foto oleh Google DeepMind
Pada 9 Juni 2026, Anthropic merilis Claude Fable 5, model pertama dari keluarga Claude 5 sekaligus anggota pertama yang tersedia umum dari tier baru bernama Mythos-class yang posisinya di atas Claude Opus. Saya sudah memakainya di Claude Code sejak minggu peluncuran, dan ini rilis model pertama dalam beberapa waktu terakhir di mana permukaan API berubah cukup besar sehingga sekadar mengganti model string bisa merusak kode produksi Anda dengan HTTP 400.
Tulisan ini adalah panduan yang saya harap ada sejak hari pertama: siapa yang sebaiknya memakai Fable 5 dibanding Opus, Sonnet, dan Haiku, seperti apa hitungan biayanya di 10 dolar input dan 50 dolar output per juta token, parameter request mana yang sekarang menghasilkan error, dan apa arti always-on thinking untuk UX streaming Anda.
Semua di sini sudah diverifikasi terhadap pengumuman peluncuran Anthropic dan dokumentasi model resmi, keduanya tertaut di kotak sumber di bawah. Tanpa benchmark bocoran, tanpa spekulasi.
Claude Fable 5 (model ID claude-fable-5) adalah model paling cerdas dari Anthropic yang tersedia umum. Ini bukan update Opus: ia meluncurkan tier baru bernama Mythos-class, yang posisinya di atas Opus. Spesifikasi utamanya: context window 1 juta token sebagai default, output hingga 128K token per request, dan tokenizer yang sama dengan Opus 4.8, jadi jumlah token kurang lebih tidak berubah kalau Anda migrasi dari Opus 4.7 atau 4.8.
Postingan peluncuran Anthropic menyatakannya dengan jelas: kemampuan Fable 5 melampaui semua model yang pernah mereka rilis untuk umum. Keunggulannya atas Opus ada di kerja agentic jangka panjang: satu giliran pada tugas berat bisa berjalan beberapa menit, dan di level effort tertinggi ia merefleksikan dan memvalidasi hasil kerjanya sendiri.
Bagaimana dengan Claude Mythos 5?
Claude Mythos 5 (claude-mythos-5) adalah model dasar yang sama tetapi ditawarkan tanpa sebagian pengaman dual-use tertentu, hanya tersedia untuk organisasi yang disetujui lewat Project Glasswing, seperti mitra cybersecurity resmi dan peneliti biomedis terpilih. Untuk yang lain, Fable 5 adalah modelnya. Harga sama, permukaan API sama.
Fable 5 harganya tepat dua kali Opus 4.8 di kedua sisi. Berikut lineup API first-party saat ini per juta token:
| Model | Input per MTok | Output per MTok | Context window |
|---|---|---|---|
| Claude Fable 5 | 10 USD | 50 USD | 1M token, output maks 128K |
| Claude Opus 4.8 | 5 USD | 25 USD | 1M token, output maks 128K |
| Claude Sonnet 4.6 | 3 USD | 15 USD | 1M token, output maks 64K |
| Claude Haiku 4.5 | 1 USD | 5 USD | 200K token, output maks 64K |
Pengali 2x itu sebenarnya masih meremehkan selisih nyatanya, karena thinking selalu aktif dan Fable 5 berpikir banyak. Sesi agentic coding panjang yang menghabiskan misalnya 2 juta token input dan 300K output di Opus 4.8 (sekitar 17,50 USD) tidak sekadar berlipat dua di Fable 5 — modelnya juga cenderung bernalar lebih dalam per langkah, jadi volume output ikut naik. Anggarkan 2x sampai 3x per tugas dalam praktik dan ukur workload Anda sendiri sebelum memindahkan pipeline ke sana.
Sisi baliknya: pada tugas jangka panjang yang benar-benar sulit, Fable 5 sering menyelesaikan dalam satu giliran apa yang butuh beberapa siklus review-dan-ulang di Opus. Kalau dihitung waktu engineer dan token dari run yang gagal, biaya per hasil bisa lebih rendah. Itu framing jujurnya: per token ini model termahal yang dijual luas oleh Anthropic; per tugas selesai ia bisa jadi yang termurah.
Setelah beberapa minggu merutekan berbagai workload ke seluruh keluarga model, ini pembagian yang saya pakai untuk proyek saya sendiri — backend ERP, portfolio ini, dan fitur AI yang saya bangun di sela waktu:
Fable 5: 5 persen tugas tersulit
Refactor otonom berjam-jam, run agentic semalaman, migrasi lintas puluhan file, debugging dalam di mana Opus berputar-putar. Beri spesifikasi tugas lengkap di awal dan biarkan jalan di effort high atau xhigh.
Opus 4.8: andalan harian
Coding sehari-hari, code review, penalaran kompleks dengan separuh harga. Ia tetap default yang direkomendasikan Anthropic untuk tugas kompleks, dan menjadi target fallback resmi saat classifier Fable 5 menolak request.
Sonnet 4.6: fitur produk bervolume tinggi
Fitur AI yang menghadap pengguna di mana latensi dan unit economics penting: summarization, ekstraksi, chat. Di 3 dan 15 dolar per MTok dengan context window 1M, ini kuda beban untuk fitur produksi.
Haiku 4.5: klasifikasi dan perekat
Routing, tagging, pemeriksaan guardrail, tugas kelas autocomplete. Di 1 dan 5 dolar per MTok ia cukup murah untuk dijalankan di setiap request dalam pipeline.
Fable 5 menghapus lebih banyak parameter request dibanding rilis Claude mana pun sebelumnya. Kalau Anda mengangkat body request era Opus 4.6 dan hanya menukar model string, bersiaplah menerima HTTP 400 invalid_request_error. Mode kegagalan persisnya:
// All three of these return HTTP 400 on claude-fable-5
await client.messages.create({
model: "claude-fable-5",
max_tokens: 16000,
temperature: 0.7, // 400 — sampling params removed
thinking: { type: "disabled" }, // 400 — thinking cannot be disabled
// thinking: { type: "enabled", budget_tokens: N } // 400 — budget_tokens removed
messages: [{ role: "user", content: "..." }],
})
// The correct shape: omit thinking entirely, control depth with effort
await client.messages.create({
model: "claude-fable-5",
max_tokens: 16000,
output_config: { effort: "high" }, // low | medium | high | xhigh | max
messages: [{ role: "user", content: "..." }],
})Pergeseran konsep terbesar: Fable 5 selalu berpikir. Tidak ada toggle, dan chain of thought mentah tidak pernah dikembalikan ke Anda. Secara default, blok thinking mengalir kembali dengan teks kosong, artinya UI Anda menampilkan jeda hening yang panjang sebelum token pertama terlihat — pada tugas berat, bisa beberapa menit tanpa apa-apa.
Solusinya adalah opsi display pada parameter thinking: minta summarized dan API akan mengalirkan ringkasan penalaran yang bisa dibaca sehingga pengguna melihat progres. Kedalaman dikontrol terpisah dengan parameter effort di dalam output_config.
// Streaming UX: request a readable summary of the reasoning,
// otherwise thinking blocks arrive with empty text and your UI
// shows a long silent pause before the first visible token.
const stream = client.messages.stream({
model: "claude-fable-5",
max_tokens: 64000,
thinking: { type: "adaptive", display: "summarized" },
output_config: { effort: "xhigh" },
messages: [{ role: "user", content: "Refactor the billing module..." }],
})Rencanakan timeout Anda dengan ini juga. Satu request Fable 5 di effort xhigh pada tugas engineering nyata bisa berjalan 10 sampai 15 menit secara wajar. Stream semuanya, naikkan timeout HTTP client, dan rancang alur cek-berkala asinkron alih-alih memblokir siklus request-response pada satu giliran raksasa.
Dengan budget_tokens hilang, output_config effort adalah cara Anda menukar kedalaman dengan biaya dan latensi. Lima level:
Fable 5 menjalankan safety classifier yang berfokus pada riset biologi dan sebagian besar konten cybersecurity. Request yang ditolak kembali sebagai HTTP 200 dengan stop_reason refusal — bukan HTTP error — jadi kode yang membaca content tanpa pengecekan akan rusak pada request yang ditolak.
Kalau Anda bekerja dekat dengan tooling keamanan, seperti saya, request yang sebenarnya aman sesekali bisa memicu false positive. Jawaban Anthropic adalah parameter beta fallbacks server-side: sebutkan claude-opus-4-8 sebagai fallback dan API mengulang request yang ditolak di Opus dalam round trip yang sama.
// Beta: retry on Opus 4.8 server-side, in one round trip
const response = await client.beta.messages.create({
model: "claude-fable-5",
max_tokens: 16000,
betas: ["server-side-fallback-2026-06-01"],
fallbacks: [{ model: "claude-opus-4-8" }],
messages: [{ role: "user", content: "..." }],
})
// Always branch on stop_reason before reading content
if (response.stop_reason === "refusal") {
// pre-output refusal: empty content, not billed
// mid-stream refusal: partial output billed — discard it
}Refusal sebelum output memiliki array content kosong dan tidak ditagih sama sekali. Refusal di tengah stream menagih output yang sudah ter-stream, dan Anda sebaiknya membuang respons parsial itu alih-alih menganggapnya selesai.
Di luar mekanika API, perilaku Fable 5 cukup berbeda sehingga prompt yang dituning untuk Opus layak ditinjau ulang:
Sumber dan bacaan lanjutan
Fable 5 bukan upgrade drop-in dan tidak diberi harga seperti itu. Perlakukan ia sebagai tier baru: pertahankan Opus 4.8 sebagai default Anda, rutekan kerja jangka panjang tersulit ke Fable 5, dan kerjakan sedikit PR API-nya — tanpa parameter sampling, tanpa konfigurasi thinking, penanganan refusal, syarat retensi — sebelum apa pun menyentuh produksi.
Aturan praktis saya setelah sebulan peluncuran: kalau tugas selesai dalam sekali duduk, Opus 4.8. Kalau tugasnya akan saya serahkan ke kontraktor selama sehari dan saya review besok, itu pekerjaan Fable 5 — spesifikasi lengkap di awal, effort xhigh, dan biarkan ia jalan.