Hermes Agent 0.18.0: Judgment Release dan Goal Contracts

Hermes Agent 0.18.0: Judgment Release, MoA, Goal Contracts, dan Agent yang Lebih Bisa Diaudit

Hermes Agent 0.18.0 sudah rilis lewat tag v2026.7.1 pada 1 Juli 2026. Nama rilisnya "The Judgment Release". Ini bukan patch kecil. Dari catatan resmi, rilis ini datang setelah sekitar 1.720 commit, 998 PR merge, dan 949 issue ditutup sejak v0.17.0.

Angka itu besar, tapi angka bukan bagian terpentingnya.

Yang paling penting dari Hermes 0.18.0 adalah arah produknya: agent tidak cukup hanya bisa mengerjakan task. Agent harus bisa menunjukkan kapan pekerjaannya benar-benar selesai, bukti apa yang dipakai, dan bagian mana yang masih perlu dicek manusia.

Itu membuat rilis ini relevan untuk tim yang memakai Hermes sebagai AI agent operasional, bukan sekadar chatbot terminal.

Sumber resmi:

GitHub release Hermes Agent v2026.7.1: https://github.com/NousResearch/hermes-agent/releases/tag/v2026.7.1
Repository Hermes Agent: https://github.com/NousResearch/hermes-agent
Dokumentasi Hermes Agent: https://hermes-agent.nousresearch.com/docs/
npm package hermes-agent 0.18.0: https://www.npmjs.com/package/hermes-agent/v/0.18.0

Ringkasan cepat

Hermes Agent 0.18.0 menarik karena lima hal:

P0/P1 clean sweep: catatan rilis menyebut semua issue dan PR P0/P1 ditutup saat release dibuat.
Mixture-of-Agents menjadi model yang bisa dipilih langsung, bukan sekadar mode.
/goal punya completion contracts, sehingga "selesai" bisa dinilai dari bukti.
/learn dan /journey membuat proses belajar agent lebih terlihat dan bisa diedit.
Gateway mendapat scale-to-zero dan drain coordination, penting untuk setup hosted atau tim.

Kesimpulan praktisnya: Hermes 0.18.0 layak diuji, terutama kalau Anda membangun agent yang dipakai untuk coding, riset, automasi, atau workflow multi-step. Untuk production, saya tetap tidak akan langsung upgrade buta. Ini rilis besar, area sentuhnya luas, dan issue baru setelah release sudah mulai muncul.

Kenapa "Judgment Release" penting

Masalah klasik AI agent bukan hanya hallucination. Masalah yang lebih operasional adalah agent sering terlalu cepat menganggap task selesai.

Contohnya begini:

Agent bilang bug sudah diperbaiki, padahal test belum jalan.
Agent membuat file baru, tapi belum dicek apakah build masih lolos.
Agent merangkum riset, tapi tidak jelas sumber mana yang dipakai.
Agent menjalankan workflow panjang, lalu berhenti karena merasa sudah cukup.

Untuk pekerjaan kecil, ini menyebalkan. Untuk kerja bisnis, ini berbahaya.

Hermes 0.18.0 mencoba memperbaiki titik itu lewat verification evidence dan completion contracts. Dalam bahasa sederhana: agent perlu punya definisi selesai yang lebih jelas. Bukan "saya rasa sudah", tapi "cek ini sudah lewat, output ini sudah ada, dan bukti ini mendukung kesimpulan."

Ini sejalan dengan cara kami melihat AI agent di pekerjaan serius: otaknya boleh generative, tapi jalur eksekusinya harus bisa diaudit.

P0/P1 clean sweep: bagus, tapi tetap perlu dibaca sehat

Release note resmi menyebut tim Hermes menutup semua P0 dan P1 di repo saat release dibuat. Mereka mencatat 3 issue P0, 8 PR P0, 493 issue P1, dan 188 PR P1 yang masuk dalam sweep prioritas.

Ini sinyal bagus. Bukan karena berarti Hermes tiba-tiba "tanpa bug", tetapi karena timnya sedang mengurangi backlog risiko paling tinggi.

Untuk user bisnis atau tim teknis, ini penting. Tool agent yang dipakai harian butuh maintainership yang agresif. Kalau P0/P1 dibiarkan menumpuk, kita tidak punya dasar kuat untuk membangun workflow di atasnya.

Namun tetap perlu disiplin:

cek issue tracker setelah release,
uji di sandbox,
backup config dan memory,
jalankan workflow yang biasa dipakai,
baru pertimbangkan upgrade production.

Rilis besar dengan banyak perubahan biasanya punya dua sisi: banyak fix, tapi juga banyak permukaan baru.

Mixture-of-Agents: dari mode jadi model

Mixture-of-Agents atau MoA sekarang menjadi bagian yang lebih serius dari sistem model Hermes.

Sebelumnya MoA lebih terasa seperti mode. Di v0.18.0, preset MoA bisa muncul sebagai model virtual di provider moa. Artinya user bisa memilih ensemble seperti memilih model biasa.

Kenapa ini menarik?

Untuk task yang butuh judgment, satu model kadang terlalu sempit. Misalnya:

audit strategi teknis,
review arsitektur workflow,
membandingkan keputusan implementasi,
riset kompetitor,
menilai risiko upgrade.

MoA membuat beberapa model referensi memberi output, lalu aggregator menyusun jawaban final. Release note juga menyebut output tiap reference model sekarang bisa ditampilkan sebagai blok terpisah, lalu jawaban aggregator streaming.

Ini bukan magic. MoA bisa lebih mahal dan lebih lambat. Tapi untuk keputusan penting, melihat reasoning dari beberapa model bisa lebih berguna daripada meminta satu model menjawab cepat.

`/goal` dengan completion contracts

Bagian ini yang paling saya suka dari rilis 0.18.0.

/goal sekarang bergerak ke arah yang lebih jelas: goal tidak hanya berupa instruksi panjang, tetapi punya kontrak selesai. Agent bisa mengecek pekerjaannya terhadap evidence, termasuk hasil test atau verifikasi lain.

Untuk coding, ini jelas berguna. Tapi untuk bisnis juga sama pentingnya.

Contoh goal yang buruk:

Buat audit website saya.

Contoh goal yang lebih bisa diaudit:

Audit 20 URL utama, catat status indexability, title, meta description, H1, canonical, schema, internal link, dan rekomendasi prioritas. Output harus berupa tabel temuan dan 10 action item.

Dengan completion contract, agent punya patokan. Kalau output belum memenuhi kontrak, seharusnya agent tidak buru-buru menganggap task selesai.

Ini arah yang benar untuk AI agent operasional.

`/learn` dan `/journey`: memory yang tidak lagi terasa kotak hitam

Hermes sejak awal kuat di ide self-improving agent. Tapi self-improvement bisa jadi aneh kalau user tidak bisa melihat apa yang dipelajari agent.

Di v0.18.0, /learn dan /journey membuat proses itu lebih eksplisit.

/learn diposisikan untuk mengubah workflow, direktori, URL, atau pengalaman tertentu menjadi skill reusable. Ini cocok untuk tim yang punya SOP berulang. Misalnya:

cara publish artikel,
cara audit SEO,
cara deploy service,
cara membuat report mingguan,
cara triage pesan customer.

/journey memberi timeline tentang memory dan skill yang dikumpulkan Hermes. User bisa melihat, mengedit, atau menghapus hal yang salah.

Ini penting. Agent yang belajar tanpa kontrol bisa mengumpulkan kebiasaan buruk. Agent yang memory-nya bisa dibaca dan dibersihkan lebih layak dipakai untuk kerja jangka panjang.

Background fan-out untuk subagents

Hermes 0.18.0 juga membuat delegation lebih enak dipakai. delegate_task bisa memecah pekerjaan ke beberapa subagent di background, lalu hasilnya kembali sebagai satu rangkuman.

Untuk workflow nyata, ini masuk akal.

Bayangkan Anda meminta agent:

audit 5 kompetitor,
cek 10 halaman service,
review beberapa modul code,
cari issue release terbaru,
rangkum feedback customer dari beberapa sumber.

Kalau semua dikerjakan linear, chat terasa macet. Dengan background fan-out, agent utama bisa tetap dipakai sambil subagent bekerja.

Tetap ada catatan: fan-out perlu guardrail. Semakin banyak subagent, semakin penting logging, scope, dan verification. Kalau tidak, parallel work hanya memindahkan kekacauan ke tempat yang lebih sulit dilihat.

Gateway scale-to-zero dan drain coordination

Untuk user pribadi, fitur ini mungkin terdengar terlalu infra. Untuk tim, ini besar.

Gateway Hermes sekarang punya scale-to-zero dan drain coordination. Dalam praktiknya, ini membantu setup yang ingin:

tidur saat idle,
bangun saat dibutuhkan,
restart atau migrasi tanpa memutus percakapan yang sedang berjalan,
lebih masuk akal untuk hosted service.

AI agent yang hidup di Telegram, Slack, WhatsApp, atau channel lain tidak boleh sering putus di tengah kerja. Drain coordination membantu lifecycle gateway jadi lebih rapi.

Kalau targetnya hanya eksperimen lokal, fitur ini belum terasa. Kalau targetnya agent operasional untuk tim, ini mulai penting.

Security round: bagian yang tidak boleh dilewati

Release note v0.18.0 juga mencatat beberapa hardening:

MCP config persistence attack surface,
cron base_url override yang bisa mengekfiltrasi credential,
sentinel untuk prefix secrets di file reads,
Slack app-level token redaction,
cloud metadata floor untuk browser backend,
dependency floor untuk aiohttp.

Saya suka bagian ini karena agent runtime memang punya risiko unik. Agent membaca file, memakai tool, menyentuh provider key, membuka browser, dan bisa menjalankan workflow otomatis. Semakin agentic sistemnya, semakin penting batas keamanan.

Untuk production, jangan hanya lihat fitur. Lihat juga security boundary.

Issue baru setelah release

Saat dicek pada 3 Juli 2026, issue tracker Hermes sudah punya laporan baru setelah v0.18.0. Beberapa contoh yang perlu dipantau:

Windows Desktop installer bisa stuck di 0% pada kondisi asosiasi .ps1 tertentu.
Desktop menampilkan duplicate branches saat workspace directory bukan git repo.
Issue P2 tentang read_file/terminal yang melewati untrusted-content wrapper untuk file eksternal.
Beberapa laporan konfigurasi model API dan dashboard plugin.

Ini bukan alasan untuk menghindari 0.18.0. Ini alasan untuk upgrade dengan cara yang benar.

Untuk laptop eksperimen, silakan coba. Untuk server tim, jalankan sandbox dulu.

Rekomendasi upgrade

Kalau Anda memakai Hermes Agent untuk eksperimen pribadi, 0.18.0 layak dicoba sekarang. Fitur MoA, /goal, /learn, /journey, dan background subagents cukup menarik untuk dieksplor.

Kalau Anda memakai Hermes untuk workflow bisnis, saya sarankan jalur ini:

Backup config, memory, skills, dan credential.
Install atau update di environment sandbox.
Jalankan workflow paling sering dipakai, bukan hanya command smoke test.
Cek gateway, messaging channel, provider model, cron, dan tool permission.
Baru jadwalkan upgrade production.

Jangan ukur dari "bisa start" saja. Ukur dari apakah workflow harian tetap jalan.

Untuk siapa rilis ini paling relevan?

Hermes 0.18.0 paling relevan untuk:

developer yang ingin agent coding dengan bukti verifikasi,
tim yang mulai menyusun SOP agentic workflow,
bisnis yang butuh agent lintas channel,
operator yang ingin memory dan skill agent bisa diaudit,
tim teknis yang ingin eksperimen MoA tanpa membangun router sendiri.

Kalau kebutuhan Anda masih sebatas tanya-jawab AI atau prompt manual, rilis ini mungkin terasa berlebihan. Tapi kalau Anda mulai masuk ke agent yang punya memory, tool, workflow, dan tanggung jawab operasional, 0.18.0 adalah rilis yang perlu diperhatikan.

Kesimpulan

Hermes Agent 0.18.0 bukan sekadar update fitur. Rilis ini mendorong Hermes ke arah agent yang lebih bisa dinilai, lebih bisa belajar, dan lebih masuk akal untuk deployment serius.

Bagian paling penting menurut saya bukan MoA atau desktop project, walaupun dua-duanya menarik. Bagian paling penting adalah perubahan cara Hermes memandang "done". Agent yang bisa menyelesaikan task harus bisa menunjukkan bukti. Tanpa itu, AI agent hanya terlihat sibuk.

Untuk production, jangan upgrade dengan gaya FOMO. Tapi jangan abaikan juga. Hermes 0.18.0 adalah rilis yang layak masuk sandbox minggu ini.

Jika tim Anda ingin belajar membangun workflow AI agent yang lebih rapi, mulai dari setup, memory, skills, gateway, SOP, sampai audit keamanan, Rama Digital punya layanan dan materi pelatihan yang relevan:

Jasa install Hermes Agent: https://ramadigital.id/services/jasa-install-hermes-agent
Pelatihan AI perusahaan: https://ramadigital.id/services/pelatihan-ai-perusahaan
Artikel Jago Hermes Agent: https://ramadigital.id/blog/jago-hermes-agent-dari-prompt-manual-ke-workflow-ai

Tags: #Hermes Agent #Hermes 0.18.0 #AI Agent #Mixture of Agents #Goal Contracts #Agentic AI

Rama Aditya

Founder Rama Digital. Menulis tentang digital marketing, web development, AI, dan sistem operasional untuk bisnis Indonesia.

Tentang Rama Digital

Ringkasan cepat

Kenapa "Judgment Release" penting

P0/P1 clean sweep: bagus, tapi tetap perlu dibaca sehat

Mixture-of-Agents: dari mode jadi model

/goal dengan completion contracts

/learn dan /journey: memory yang tidak lagi terasa kotak hitam

Background fan-out untuk subagents

Gateway scale-to-zero dan drain coordination

Security round: bagian yang tidak boleh dilewati

Issue baru setelah release

Rekomendasi upgrade

Untuk siapa rilis ini paling relevan?

Kesimpulan

Artikel yang masih relevan

Cara Install Hermes Agent di Linux: Setup Aman untuk VPS, Server, dan Laptop

Update OpenClaw 2026.6.1: Rilis Stabil untuk Recovery Runtime, Channel, Skill Workshop, dan Provider

OpenClaw 2026.3.31: Approval Makin Rapi, Memory Makin Tajam, dan Flow Control Makin Matang

Siap transformasi bisnis Anda dalam 2-5 minggu?

`/goal` dengan completion contracts

`/learn` dan `/journey`: memory yang tidak lagi terasa kotak hitam