Berapa biaya Claude Fable 5 dibanding Opus 4.8, dan berapa anggaran yang perlu disiapkan untuk tugas agentic?

Fable 5 harganya $10 per juta token input dan $50 per juta token output — tepat dua kali lipat Opus 4.8 yang $5 input dan $25 output. Namun karena thinking selalu aktif dan model bernalar lebih dalam per langkah, volume output cenderung tumbuh melampaui pengali 2x sederhana. Artikel ini menyarankan menganggarkan 2x sampai 3x per tugas dalam praktik dan mengukur workload sendiri sebelum memindahkan pipeline ke Fable 5.

Parameter API apa yang dihapus di Fable 5 dan kenapa saya mendapat error HTTP 400 setelah mengganti model string?

Fable 5 menghapus temperature, top_p, dan top_k (parameter sampling), parameter thinking (selalu aktif dan tidak bisa dimatikan), serta dukungan assistant prefill. Jika org Anda dikonfigurasi zero data retention, setiap request mengembalikan 400 terlepas dari validitas payload — Fable 5 mewajibkan retensi data 30 hari. Solusinya adalah menghapus parameter-parameter tersebut, beralih ke structured outputs lewat output_config format untuk memaksa JSON, dan memeriksa pengaturan retensi org sebelum men-debug body request.

Bagaimana always-on thinking memengaruhi UX streaming, dan bagaimana cara menampilkan progres ke pengguna?

Karena Fable 5 selalu berpikir dan tidak pernah mengembalikan chain of thought mentah, perilaku default-nya adalah blok thinking yang mengalir dengan teks kosong — menyebabkan jeda hening yang bisa berlangsung beberapa menit sebelum token pertama muncul. Solusinya adalah mengatur opsi display pada parameter thinking menjadi summarized, sehingga API mengalirkan ringkasan penalaran yang bisa dibaca agar pengguna melihat progres. Artikel ini juga menyarankan menaikkan timeout HTTP client dan merancang alur cek-berkala asinkron, karena satu request effort xhigh bisa berjalan 10 sampai 15 menit secara wajar.

Kapan sebaiknya memakai Fable 5 dibanding Opus 4.8, Sonnet 4.6, atau Haiku 4.5?

Artikel ini merekomendasikan Fable 5 hanya untuk 5 persen tugas tersulit: refactor otonom berjam-jam, run agentic semalaman, dan debugging dalam di mana Opus berputar-putar. Opus 4.8 tetap menjadi andalan harian untuk coding dan penalaran kompleks dengan separuh harga. Sonnet 4.6 cocok untuk fitur produk bervolume tinggi seperti summarization dan chat di $3/$15 per MTok, sementara Haiku 4.5 menangani routing, tagging, dan pemeriksaan guardrail di $1/$5 per MTok.

Claude Fable 5: Yang Perlu Developer Ketahui

Pada 9 Juni 2026, Anthropic merilis Claude Fable 5, model pertama dari keluarga Claude 5 sekaligus anggota pertama yang tersedia umum dari tier baru bernama Mythos-class yang posisinya di atas Claude Opus. Saya sudah memakainya di Claude Code sejak minggu peluncuran, dan ini rilis model pertama dalam beberapa waktu terakhir di mana permukaan API berubah cukup besar sehingga sekadar mengganti model string bisa merusak kode produksi Anda dengan HTTP 400.

Tulisan ini adalah panduan yang saya harap ada sejak hari pertama: siapa yang sebaiknya memakai Fable 5 dibanding Opus, Sonnet, dan Haiku, seperti apa hitungan biayanya di 10 dolar input dan 50 dolar output per juta token, parameter request mana yang sekarang menghasilkan error, dan apa arti always-on thinking untuk UX streaming Anda.

Semua di sini sudah diverifikasi terhadap pengumuman peluncuran Anthropic dan dokumentasi model resmi, keduanya tertaut di kotak sumber di bawah. Tanpa benchmark bocoran, tanpa spekulasi.

Apa Sebenarnya Claude Fable 5?

Claude Fable 5 (model ID claude-fable-5) adalah model paling cerdas dari Anthropic yang tersedia umum. Ini bukan update Opus: ia meluncurkan tier baru bernama Mythos-class, yang posisinya di atas Opus. Spesifikasi utamanya: context window 1 juta token sebagai default, output hingga 128K token per request, dan tokenizer yang sama dengan Opus 4.8, jadi jumlah token kurang lebih tidak berubah kalau Anda migrasi dari Opus 4.7 atau 4.8.

Postingan peluncuran Anthropic menyatakannya dengan jelas: kemampuan Fable 5 melampaui semua model yang pernah mereka rilis untuk umum. Keunggulannya atas Opus ada di kerja agentic jangka panjang: satu giliran pada tugas berat bisa berjalan beberapa menit, dan di level effort tertinggi ia merefleksikan dan memvalidasi hasil kerjanya sendiri.

Bagaimana dengan Claude Mythos 5?

Claude Mythos 5 (claude-mythos-5) adalah model dasar yang sama tetapi ditawarkan tanpa sebagian pengaman dual-use tertentu, hanya tersedia untuk organisasi yang disetujui lewat Project Glasswing, seperti mitra cybersecurity resmi dan peneliti biomedis terpilih. Untuk yang lain, Fable 5 adalah modelnya. Harga sama, permukaan API sama.

Harga: Hitungan Biaya vs Opus, Sonnet, dan Haiku

Fable 5 harganya tepat dua kali Opus 4.8 di kedua sisi. Berikut lineup API first-party saat ini per juta token:

Model	Input per MTok	Output per MTok	Context window
Claude Fable 5	10 USD	50 USD	1M token, output maks 128K
Claude Opus 4.8	5 USD	25 USD	1M token, output maks 128K
Claude Sonnet 4.6	3 USD	15 USD	1M token, output maks 64K
Claude Haiku 4.5	1 USD	5 USD	200K token, output maks 64K

Pengali 2x itu sebenarnya masih meremehkan selisih nyatanya, karena thinking selalu aktif dan Fable 5 berpikir banyak. Sesi agentic coding panjang yang menghabiskan misalnya 2 juta token input dan 300K output di Opus 4.8 (sekitar 17,50 USD) tidak sekadar berlipat dua di Fable 5 — modelnya juga cenderung bernalar lebih dalam per langkah, jadi volume output ikut naik. Anggarkan 2x sampai 3x per tugas dalam praktik dan ukur workload Anda sendiri sebelum memindahkan pipeline ke sana.

Sisi baliknya: pada tugas jangka panjang yang benar-benar sulit, Fable 5 sering menyelesaikan dalam satu giliran apa yang butuh beberapa siklus review-dan-ulang di Opus. Kalau dihitung waktu engineer dan token dari run yang gagal, biaya per hasil bisa lebih rendah. Itu framing jujurnya: per token ini model termahal yang dijual luas oleh Anthropic; per tugas selesai ia bisa jadi yang termurah.

Model Mana yang Sebaiknya Anda Pakai? Pembagian Praktis

Setelah beberapa minggu merutekan berbagai workload ke seluruh keluarga model, ini pembagian yang saya pakai untuk proyek saya sendiri — backend ERP, portfolio ini, dan fitur AI yang saya bangun di sela waktu:

Fable 5: 5 persen tugas tersulit

Refactor otonom berjam-jam, run agentic semalaman, migrasi lintas puluhan file, debugging dalam di mana Opus berputar-putar. Beri spesifikasi tugas lengkap di awal dan biarkan jalan di effort high atau xhigh.

Opus 4.8: andalan harian

Coding sehari-hari, code review, penalaran kompleks dengan separuh harga. Ia tetap default yang direkomendasikan Anthropic untuk tugas kompleks, dan menjadi target fallback resmi saat classifier Fable 5 menolak request.

Sonnet 4.6: fitur produk bervolume tinggi

Fitur AI yang menghadap pengguna di mana latensi dan unit economics penting: summarization, ekstraksi, chat. Di 3 dan 15 dolar per MTok dengan context window 1M, ini kuda beban untuk fitur produksi.

Haiku 4.5: klasifikasi dan perekat

Routing, tagging, pemeriksaan guardrail, tugas kelas autocomplete. Di 1 dan 5 dolar per MTok ia cukup murah untuk dijalankan di setiap request dalam pipeline.

Jebakan Migrasi API: Dari Mana 400 Itu Datang

Fable 5 menghapus lebih banyak parameter request dibanding rilis Claude mana pun sebelumnya. Kalau Anda mengangkat body request era Opus 4.6 dan hanya menukar model string, bersiaplah menerima HTTP 400 invalid_request_error. Mode kegagalan persisnya:

// All three of these return HTTP 400 on claude-fable-5
await client.messages.create({
  model: "claude-fable-5",
  max_tokens: 16000,
  temperature: 0.7,                                  // 400 — sampling params removed
  thinking: { type: "disabled" },                    // 400 — thinking cannot be disabled
  // thinking: { type: "enabled", budget_tokens: N } // 400 — budget_tokens removed
  messages: [{ role: "user", content: "..." }],
})

// The correct shape: omit thinking entirely, control depth with effort
await client.messages.create({
  model: "claude-fable-5",
  max_tokens: 16000,
  output_config: { effort: "high" }, // low | medium | high | xhigh | max
  messages: [{ role: "user", content: "..." }],
})

Parameter sampling hilang. temperature, top_p, dan top_k semuanya mengembalikan 400. Prompting kini satu-satunya cara mengarahkan variasi output.
Parameter thinking harus dihilangkan sepenuhnya. Mengirim type disabled atau nilai budget_tokens sama-sama mengembalikan 400 — thinking selalu aktif dan tidak bisa dimatikan.
Assistant prefill tidak didukung. Kalau Anda biasa mengisi giliran assistant untuk memaksa JSON, beralihlah ke structured outputs lewat output_config format.
Fable 5 mewajibkan retensi data 30 hari. Kalau org Anda dikonfigurasi zero data retention, setiap request mengembalikan 400 bahkan dengan payload yang sepenuhnya valid — periksa pengaturan retensi sebelum men-debug body request Anda.
Jumlah token kurang lebih sama dengan Opus 4.7 dan 4.8 karena tokenizernya sama. Kalau datang dari Opus 4.6, Sonnet, atau Haiku, ukur ulang dengan endpoint count_tokens — tokenizer yang lebih baru menghasilkan kira-kira 30 persen lebih banyak token pada teks yang sama.

Always-On Thinking dan UX Streaming Anda

Pergeseran konsep terbesar: Fable 5 selalu berpikir. Tidak ada toggle, dan chain of thought mentah tidak pernah dikembalikan ke Anda. Secara default, blok thinking mengalir kembali dengan teks kosong, artinya UI Anda menampilkan jeda hening yang panjang sebelum token pertama terlihat — pada tugas berat, bisa beberapa menit tanpa apa-apa.

Solusinya adalah opsi display pada parameter thinking: minta summarized dan API akan mengalirkan ringkasan penalaran yang bisa dibaca sehingga pengguna melihat progres. Kedalaman dikontrol terpisah dengan parameter effort di dalam output_config.

// Streaming UX: request a readable summary of the reasoning,
// otherwise thinking blocks arrive with empty text and your UI
// shows a long silent pause before the first visible token.
const stream = client.messages.stream({
  model: "claude-fable-5",
  max_tokens: 64000,
  thinking: { type: "adaptive", display: "summarized" },
  output_config: { effort: "xhigh" },
  messages: [{ role: "user", content: "Refactor the billing module..." }],
})

Rencanakan timeout Anda dengan ini juga. Satu request Fable 5 di effort xhigh pada tugas engineering nyata bisa berjalan 10 sampai 15 menit secara wajar. Stream semuanya, naikkan timeout HTTP client, dan rancang alur cek-berkala asinkron alih-alih memblokir siklus request-response pada satu giliran raksasa.

Parameter Effort: Satu-Satunya Kenop Kedalaman

Dengan budget_tokens hilang, output_config effort adalah cara Anda menukar kedalaman dengan biaya dan latensi. Lima level:

low — kerja rutin, sub-agent, jalur yang sensitif latensi. Menariknya, effort low di Fable 5 sering mengalahkan effort max di model lama.
medium — tugas produksi hemat biaya yang tetap butuh penalaran nyata.
high — default yang masuk akal untuk kerja yang sensitif terhadap kecerdasan.
xhigh — workload coding dan agentic; ini default yang dipakai Claude Code.
max — run kritis-kebenaran dan tidak sensitif latensi di mana Anda ingin verifikasi diri maksimal.

Refusal, Safety Classifier, dan Fallback Server-Side

Fable 5 menjalankan safety classifier yang berfokus pada riset biologi dan sebagian besar konten cybersecurity. Request yang ditolak kembali sebagai HTTP 200 dengan stop_reason refusal — bukan HTTP error — jadi kode yang membaca content tanpa pengecekan akan rusak pada request yang ditolak.

Kalau Anda bekerja dekat dengan tooling keamanan, seperti saya, request yang sebenarnya aman sesekali bisa memicu false positive. Jawaban Anthropic adalah parameter beta fallbacks server-side: sebutkan claude-opus-4-8 sebagai fallback dan API mengulang request yang ditolak di Opus dalam round trip yang sama.

// Beta: retry on Opus 4.8 server-side, in one round trip
const response = await client.beta.messages.create({
  model: "claude-fable-5",
  max_tokens: 16000,
  betas: ["server-side-fallback-2026-06-01"],
  fallbacks: [{ model: "claude-opus-4-8" }],
  messages: [{ role: "user", content: "..." }],
})

// Always branch on stop_reason before reading content
if (response.stop_reason === "refusal") {
  // pre-output refusal: empty content, not billed
  // mid-stream refusal: partial output billed — discard it
}

Refusal sebelum output memiliki array content kosong dan tidak ditagih sama sekali. Refusal di tengah stream menagih output yang sudah ter-stream, dan Anda sebaiknya membuang respons parsial itu alih-alih menganggapnya selesai.

Pergeseran Perilaku yang Layak Di-tuning Ulang

Di luar mekanika API, perilaku Fable 5 cukup berbeda sehingga prompt yang dituning untuk Opus layak ditinjau ulang:

Ia unggul dalam delegasi sub-agent paralel. Guardrail era model lama yang menekan pemunculan sub-agent justru merugikannya — beri tahu kapan delegasi diinginkan dan biarkan ia menyebar.
Ia diuntungkan oleh permukaan memori. Bahkan file markdown polos tempat ia menulis pembelajaran terbukti meningkatkan kerja multi-sesi. Beri tahu di mana filenya dan format apa yang dipakai.
Ia lebih suka spesifikasi tugas lengkap di awal. Satu giliran pembuka yang terspesifikasi baik mengalahkan tetesan klarifikasi — prompting ambigu yang progresif memboroskan token dan menurunkan kualitas.
Prompt yang terlalu preskriptif dari model lama bisa menurunkan kualitas outputnya. A/B workload Anda dengan scaffolding langkah-demi-langkah dihapus; nyatakan tujuan dan batasan, bukan prosedurnya.

Checklist Migrasi

Tukar model string ke claude-fable-5 dan hapus temperature, top_p, top_k, serta semua konfigurasi thinking dari body request.
Ganti assistant prefill dengan structured outputs atau instruksi system prompt.
Pastikan retensi data org Anda minimal 30 hari — org zero-data-retention sama sekali tidak bisa memakai Fable 5.
Tambahkan penanganan stop_reason refusal sebelum membaca content, dan pertimbangkan beta fallbacks server-side dengan Opus 4.8 sebagai target.
Set thinking display ke summarized kalau pengguna menonton stream, uji semua level effort termasuk low dan medium untuk kerja rutin, dan ukur ulang biaya pada trafik Anda sendiri.

Sumber dan bacaan lanjutan

Intinya

Fable 5 bukan upgrade drop-in dan tidak diberi harga seperti itu. Perlakukan ia sebagai tier baru: pertahankan Opus 4.8 sebagai default Anda, rutekan kerja jangka panjang tersulit ke Fable 5, dan kerjakan sedikit PR API-nya — tanpa parameter sampling, tanpa konfigurasi thinking, penanganan refusal, syarat retensi — sebelum apa pun menyentuh produksi.

Aturan praktis saya setelah sebulan peluncuran: kalau tugas selesai dalam sekali duduk, Opus 4.8. Kalau tugasnya akan saya serahkan ke kontraktor selama sehari dan saya review besok, itu pekerjaan Fable 5 — spesifikasi lengkap di awal, effort xhigh, dan biarkan ia jalan.

Pertanyaan Umum

Claude Fable 5: Yang Perlu Developer Ketahui

Pertanyaan Umum

Claude Fable 5: Yang Perlu Developer Ketahui

Apa Sebenarnya Claude Fable 5?

Harga: Hitungan Biaya vs Opus, Sonnet, dan Haiku

Model Mana yang Sebaiknya Anda Pakai? Pembagian Praktis

Jebakan Migrasi API: Dari Mana 400 Itu Datang

Always-On Thinking dan UX Streaming Anda

Parameter Effort: Satu-Satunya Kenop Kedalaman

Refusal, Safety Classifier, dan Fallback Server-Side

Pergeseran Perilaku yang Layak Di-tuning Ulang

Checklist Migrasi

Intinya

Apa Sebenarnya Claude Fable 5?

Harga: Hitungan Biaya vs Opus, Sonnet, dan Haiku

Model Mana yang Sebaiknya Anda Pakai? Pembagian Praktis

Jebakan Migrasi API: Dari Mana 400 Itu Datang

Always-On Thinking dan UX Streaming Anda

Parameter Effort: Satu-Satunya Kenop Kedalaman

Refusal, Safety Classifier, dan Fallback Server-Side

Pergeseran Perilaku yang Layak Di-tuning Ulang

Checklist Migrasi

Intinya