AI Fundamentals

How Large Language
Models actually work

Gimana sih Large Language
Models itu bekerja?

A plain-language teaching session covering what AI is, how LLMs work, what they can and can't do, their failure modes — and when to use Claude, Gemini, or ChatGPT.

Sesi belajar santai yang bahas tuntas: AI itu sebenarnya apa, cara kerja LLM, apa yang bisa dan nggak bisa mereka lakuin, kenapa mereka bisa salah — plus kapan enaknya pakai Claude, Gemini, atau ChatGPT.

7 topics covered7 topik yang dibahas

AI hierarchy · LLMs · How they fail · Capabilities · Claude vs GPT vs Gemini Hierarki AI · LLM · Cara mereka gagal · Kemampuan · Claude vs GPT vs Gemini

No jargon left unexplainedSemua istilah dikupas tuntas

Every technical term comes with a real-world analogy Tiap istilah teknis ada analoginya biar gampang nyantol

01 / 07

FoundationFondasi

02 / 07

The AI family — nested like Russian dolls

Keluarga besar AI — kayak boneka Matryoshka

These terms get used interchangeably. They shouldn't. Each one lives inside the one above it.

Banyak orang pakai istilah-istilah ini campur aduk. Padahal beda lho. Bayangin aja kayak boneka Matryoshka — yang kecil ada di dalam yang besar.

🌍

Artificial Intelligence (AI)

Any computer system doing something we call "intelligent" — chess, face recognition, translation.

Semua sistem komputer yang bisa ngerjain hal-hal yang butuh kecerdasan — main catur, kenali wajah, terjemahin bahasa.

"Vehicles" — a huge category.

Ibarat kata "kendaraan" — kategorinya luas banget.

📚

Machine Learning (ML)

AI that learns from examples instead of hard-coded rules. Show it 10,000 spam emails; it learns the pattern itself.

AI yang belajar dari contoh, bukan dari aturan yang ditulis manual. Kasih lihat 10.000 email spam — dia belajar sendiri polanya.

Teaching a child by showing examples, not writing a rulebook.

Kayak ngajarin anak kecil pakai contoh, bukan kamus aturan.

🧠

Deep Learning

ML using stacked layers of calculations. Layer 1 sees edges. Layer 5 sees "cat." Depth = abstraction.

ML yang pakai banyak lapisan perhitungan. Lapisan pertama lihat garis-garis. Lapisan kelima udah bisa bilang "itu kucing." Makin dalam, makin abstrak.

Peeling an onion — each layer reveals deeper meaning.

Kayak ngupas bawang — tiap lapisan makin dalam maknanya.

💬

Large Language Models (LLMs)

Deep learning trained on massive text. Powers Claude, ChatGPT, Gemini. Predicts likely next words.

Deep learning yang dilatih pakai teks dalam jumlah gila-gilaan. Inilah yang ada di balik Claude, ChatGPT, dan Gemini. Tugasnya: tebak kata selanjutnya.

A student who has read almost every book, article, and webpage ever written.

Bayangin mahasiswa yang udah baca hampir semua buku, artikel, dan halaman web yang pernah ada.

The transport analogy:
AI = "vehicles." ML = "motor vehicles." Deep Learning = "cars." LLMs = "electric cars."

Every electric car is a car — but not every vehicle is electric.

Analogi transportasi:
AI = "kendaraan." ML = "kendaraan bermotor." Deep Learning = "mobil." LLM = "mobil listrik."

Semua mobil listrik ya mobil — tapi nggak semua kendaraan itu listrik. Sama logikanya!

Key insightYang paling penting dipahami

Nobody programmed grammar or facts into LLMs. They emerged from billions of corrections during training — just like a child learning to speak by hearing corrections over and over.

Nggak ada yang nulis grammar atau fakta ke dalam LLM secara manual. Semua itu muncul sendiri dari miliaran koreksi selama proses training — persis kayak anak kecil yang belajar ngomong dari kesalahan yang terus dikoreksi.

What makes them "Large"?Kenapa disebut "Large"?

GPT-4 has ~1.8 trillion parameters. Training cost hundreds of millions of dollars. Size ≈ capability — bigger models reason better.

GPT-4 punya sekitar 1,8 triliun parameter — angka yang susah dibayangkan. Biaya trainingnya ratusan juta dolar. Sederhananya: makin besar modelnya, makin pintar cara berpikirnya.

Core mechanismCara kerjanya

03 / 07

How LLMs actually work

Sebenernya LLM itu ngapain aja sih?

One simple trick repeated billions of times: predict the next word. Done at scale, it produces something that looks like intelligence.

Satu trik sederhana yang diulang miliaran kali: tebak kata berikutnya. Kedengarannya sepele — tapi kalau dilakukan dalam skala raksasa, hasilnya terlihat kayak kecerdasan beneran.

Training — the piano practice analogyProses training — ibarat latihan piano

1

Feed it text.Kasih makan teks. Trillions of words — books, websites, code.Triliunan kata dari buku, website, kode program — pokoknya semua yang bisa dibaca.

2

Guess the next word.Coba tebak kata berikutnya. "The cat sat on the ___""Kucing itu duduk di atas ___" — modelnya harus nebak.

3

Get corrected.Dapat koreksi. Real answer was "roof." Adjust slightly.Jawaban yang bener ternyata "atap." Semua pengaturan internal diubah sedikit.

4

Repeat billions of times.Ulangi ini miliaran kali. Grammar, facts, reasoning emerge on their own.Lama-lama tata bahasa, fakta, dan cara bernalar muncul dengan sendirinya — tanpa diprogram!

Tokens — the lego bricks of languageToken — kayak potongan Lego bahasa

LLMs read tokens — chunks of ~4 characters. "unbelievable" becomes "un" + "believ" + "able".

LLM nggak baca kata per kata. Mereka baca token — potongan kecil sekitar 4 karakter. Kata "luar biasa" bisa jadi "luar" + " bi" + "asa".

The

cat

sat

on

the

mat

Context window — the desk analogyContext window — ibarat meja kerja

An LLM can only "see" a fixed amount of text at once. Anything outside is invisible — as if it was never said.

LLM cuma bisa "lihat" sejumlah teks tertentu sekaligus. Di luar batas itu? Gelap. Seolah-olah nggak pernah diucapkan sama sekali.

Filling the context window:Begini kalau context window mulai penuh:

Your conversation so farObrolan kamu sejauh ini

When the desk is full, oldest notes fall off the edge.Kalau mejanya udah penuh, catatan lama terjatuh — hilang.

Like a whiteboard: A smart consultant who can only see what fits on one whiteboard. Keep adding and older notes get erased.

Kayak papan tulis: Bayangin konsultan super pintar yang cuma bisa lihat apa yang muat di satu papan tulis. Terus nulis? Catatan lama ke-erase otomatis.

Parameters — the harp strings analogyParameter — ibarat senar harpa raksasa

Billions of tiny numbers inside the model. Each gets nudged slightly when the model is wrong. After training they're frozen — together they encode everything the model "knows."

Di dalam model ada miliaran angka kecil. Tiap kali model salah jawab, angka-angka itu digeser dikit. Setelah training selesai, semua angka itu dikunci — dan itulah yang nyimpen semua "pengetahuan" si model.

CapabilitiesKemampuan

04 / 07

What LLMs can and can't do

LLM itu jago ngapain, dan lemah di mana?

LLMs are extraordinarily capable at language tasks — and surprisingly brittle at things that feel simple.

LLM luar biasa jago soal bahasa — tapi bisa kaget sendiri pas tau betapa lemahnya mereka di hal-hal yang kedengarannya sepele.

✓ StrengthsJago di sini

Summarise long documentsRangkum dokumen panjang Write & explain codeNulis & jelasin kode Translate languagesTerjemahin bahasa Draft emails & reportsBikinin draf email & laporan Explain complex topics simplyJelasin hal rumit dengan gampang Brainstorm ideasBrainstorming ide bareng Answer from provided textJawab pertanyaan dari teks yang dikasih Multi-step reasoningNalar bertahap yang kompleks

✗ LimitationsKurang jago di sini

Reliable arithmeticHitung-hitungan yang bisa diandalkan Knowing today's news (no tools)Tau berita hari ini (tanpa alat bantu) Guaranteed accurate factsFakta yang 100% dijamin bener Remembering past chatsInget obrolan sebelumnya Acting in the world (no tools)Lakuin aksi nyata (tanpa alat bantu) Precise counting or logicHitung presisi atau logika ketat

Why maths is hard: Asking an LLM to do arithmetic is like asking a literature professor to mentally calculate your taxes. They might get it right — but they're pattern-matching words about numbers, not actually computing. A calculator is always better.

Kenapa matematika susah buat LLM? Minta LLM ngitung itu kayak minta profesor sastra ngitung pajak kamu di kepala. Mungkin bisa, mungkin nggak — soalnya mereka mencocokkan pola kata tentang angka, bukan beneran ngitung. Kalkulator biasa masih jauh lebih andal!

RAG fixes the knowledge gap: RAG gives the model a librarian who fetches relevant documents before answering — turning a closed-book exam into an open-book one. This is how AI assistants access your company's internal documents.

RAG jadi solusinya: RAG itu kayak ngasih model seorang asisten pustakawan yang nyariin dokumen relevan dulu sebelum jawab — ujian yang tadinya tutup buku jadi buka buku. Makanya asisten AI bisa akses dokumen internal kantor kamu!

Failure modesKenapa bisa salah?

05 / 07

How and why LLMs fail

Cara dan alasan LLM bisa meleset

These aren't bugs waiting to be fixed. They're fundamental properties of how these models work — understanding them makes you a better AI user.

Ini bukan bug yang ntar dipatch. Ini udah jadi sifat dasar cara model ini bekerja. Tapi kalau kamu ngerti ini, kamu bakal jauh lebih pinter pakai AI.

🎭 HallucinationHalusinasi — ngomong yakin tapi salah

The model generates a fluent, confident answer that is simply false. It doesn't know it's wrong — it's completing a pattern, not checking facts.

Model ngasih jawaban yang lancar dan super PD, tapi ternyata salah total. Dia nggak sadar salah — dia lagi melengkapi pola, bukan ngecek fakta ke ensiklopedia.

"The party guest who never says 'I don't know' — sounds credible, but the facts are invented."

"Kayak tamu pesta yang nggak pernah mau bilang 'nggak tau' — kedengarannya meyakinkan banget, padahal faktanya dikarang-karang."

Niche factsFakta yang spesifik banget Specific datesTanggal & angka spesifik CitationsKutipan & referensi

📋 Context limitBatas ingatan — model bisa "lupa"

Once the conversation exceeds the context window, earlier instructions or facts become invisible — as if they were never said.

Kalau obrolan udah terlalu panjang dan melewati batas context window, instruksi atau info yang kamu kasih di awal bisa jadi nggak keliatan lagi — seolah kamu nggak pernah bilang apa-apa.

"The whiteboard consultant: when it fills up, older notes get erased to make room."

"Kayak konsultan dengan papan tulis — kalau udah penuh, catatan lama dihapus buat kasih ruang yang baru."

Long documentsDokumen super panjang Long chatsObrolan yang kepanjangan

🙋 Sycophancy — the yes-man problemSycophancy — si tukang iya-iya

Models learn to tell you what you want to hear because agreeable answers score higher in training ratings. Not lies — but unhelpful agreement.

Model belajar untuk bilang apa yang pengen kamu denger, karena pas training, jawaban yang menyenangkan dapet nilai lebih tinggi dari penilai manusia. Bukan bohong — tapi jadi nggak jujur.

"The overeager intern: you suggest a bad idea, they say 'great idea!' — agreement gets rewarded."

"Kayak magang yang terlalu semangat: kamu usul ide jelek, dia langsung bilang 'wah bagus banget!' — karena selama training, ngiyain itu selalu dapet poin."

📅 Knowledge cutoffPengetahuan berhenti di satu titik

Training has an end date. The model knows nothing after that date unless given tools like web search — like someone who's been off-grid for two years.

Training ada tanggal selesainya. Model nggak tau apa-apa yang terjadi setelah tanggal itu kecuali dikasih akses ke internet — kayak orang yang baru balik dari 2 tahun liburan tanpa sinyal.

"Asking about current events returns confident but outdated answers."

"Nanya soal berita terkini? Jawabannya bisa PD banget tapi udah basi."

🎯 How to reduce these risksCara ngurangin risikonya

Against hallucination Biar nggak ketipu halusinasi Ask the model to cite sources. Verify specific facts. Use RAG for factual tasks. Minta model nyebutin sumbernya. Cek ulang fakta yang spesifik. Pakai RAG kalau tugasnya butuh data akurat.

Against sycophancy Biar nggak dapet jawaban asal senengin Ask "what's wrong with this idea?" Push back. Request the counterargument explicitly. Tanya langsung: "Apa yang salah dari ide ini?" Dorong balik. Minta argumen sebaliknya secara eksplisit.

Against context limits Biar nggak lupa instruksi penting Summarise long context periodically. Start fresh conversations for new topics. Rangkum obrolan panjang secara berkala. Kalau topiknya beda, mending mulai chat baru aja.

RAG & MCPRAG & MCP

06 / 08

RAG & MCP — giving AI eyes and hands

RAG & MCP — ngasih AI mata dan tangan

By default, an LLM is isolated — no internet, no files, no memory. RAG and MCP are the two main ways to fix that.

Secara default, LLM itu terisolasi — nggak ada internet, nggak bisa buka file, nggak inget apapun. RAG dan MCP adalah dua cara utama buat ngatasin itu.

RAG — Retrieval-Augmented Generation

RAG lets an LLM search a knowledge base before answering. Instead of relying only on training, it fetches the most relevant documents and reads them first — then answers based on what it found.

RAG bikin LLM bisa nyari dulu di database pengetahuan sebelum jawab. Jadi bukan cuma ngandelin training — dia ambil dokumen yang paling relevan, baca dulu, baru jawab berdasarkan isinya.

1

You ask: "What's our refund policy?"Kamu nanya: "Apa kebijakan refund kita?"

2

System searches your documents for relevant pagesSistem nyari halaman relevan dari dokumen kamu

3

Those pages are handed to the LLM along with your questionHalaman-halaman itu dikasih ke LLM bareng pertanyaan kamu

4

LLM reads and answers — now grounded in your actual documentsLLM baca dan jawab — sekarang berdasarkan dokumen kamu yang asli

The open-book exam analogy: Analogi ujian buka buku: Without RAG = closed-book exam — answer from memory only. With RAG = open-book — a librarian sprints to get the right pages before you answer. Tanpa RAG = ujian tutup buku — jawab dari ingatan doang. Dengan RAG = ujian buka buku — ada pustakawan yang lari duluan ngambil halaman yang kamu butuhin.

MCP — Model Context Protocol

MCP is an open standard (by Anthropic) that lets an AI connect to external tools — calendars, databases, browsers, files — in a consistent, plug-and-play way. Think of it as USB-C for AI: one universal connector that works with everything.

MCP adalah standar terbuka (dibuat Anthropic) yang bikin AI bisa nyambung ke tools eksternal — kalender, database, browser, file — dengan cara yang seragam dan tinggal colok. Bayangin kayak USB-C buat AI: satu konektor universal yang bisa masuk ke mana-mana.

Without MCP — custom wiring for every toolTanpa MCP — tiap tools butuh kabel sendiri

AI ←custom→ SlackAI ←custom→ GmailAI ←custom→ Database AI ←custom→ SlackAI ←custom→ GmailAI ←custom→ Database

With MCP — one standard for everythingDengan MCP — satu standar buat semua

Slack → MCP → AI ← MCP ← Gmail
Any tool. Same plug. One standard. Tools apa pun. Colokan sama. Satu standar.

Read & write filesBaca & tulis file Search the webCari di internet Check calendarCek kalender Run codeJalanin kode Query databasesQuery database

RAG vs MCP in one line: RAG vs MCP dalam satu kalimat: RAG gives AI a library to read from. MCP gives AI hands to act with. RAG is about fetching knowledge — MCP is about doing things. RAG ngasih AI perpustakaan buat dibaca. MCP ngasih AI tangan buat bertindak. RAG soal ngambil pengetahuan — MCP soal ngelakuin sesuatu.

Platform comparisonPerbandingan platform

07 / 09

Claude vs ChatGPT vs Gemini — busting myths

Claude vs ChatGPT vs Gemini — lurusin miskonsepsi

Common belief: ChatGPT = empathy & personality, Claude = cold data analysis. Reality? It's the opposite — and understanding why matters.

Anggapan umum: ChatGPT = empatik & personal, Claude = analisis data yang kaku. Faktanya? Justru sebaliknya — dan penting banget buat dipahami kenapa.

⚠️

Common misconceptionMiskonsepsi yang beredar

"ChatGPT feels warmer and more personal, so it must be better at empathy." — Warmth of tone is not the same as depth of understanding. ChatGPT's agreeable, casual tone can feel empathetic — but it's closely linked to sycophancy (telling you what you want to hear). Claude was explicitly designed to understand human context carefully, which is the real foundation of empathy. "ChatGPT kesannya lebih hangat dan personal, berarti lebih empatik dong." — Nada yang hangat itu beda sama kedalaman pemahaman. Gaya ChatGPT yang santai dan setuju-setuju bisa keliatan empatik — tapi itu sangat dekat dengan sycophancy (bilang apa yang kamu mau denger). Claude justru dirancang khusus buat memahami konteks manusia secara hati-hati, dan itulah fondasi empati yang sesungguhnya.

Claude

by Anthropic · Honest & context-awareJujur & peka konteks

Actually best forSebenernya paling oke buat

Genuine empathy & sensitive writingEmpati asli & nulis hal sensitif
Long documents & deep analysis (200k context)Dokumen panjang & analisis mendalam (200k)
Honest feedback — won't just agree with youFeedback jujur — nggak bakal asal setuju
Ethical, nuanced, multi-perspective topicsTopik etis, bernuansa, banyak sudut pandang
Coding with careful explanationsCoding dengan penjelasan yang hati-hati

ChatGPT

by OpenAI · Versatile ecosystemEkosistem paling lengkap

Actually best forSebenernya paling oke buat

Broadest plugin & tool ecosystemPlugin & tools paling lengkap
Image generation (DALL-E built-in)Bikin gambar langsung (DALL-E bawaan)
Voice mode conversationsNgobrol pakai suara
Fast first drafts & general tasksDraf cepat & tugas-tugas umum
Custom GPTs & workflow automationGPT custom & otomatisasi workflow

Gemini

by Google · Real-time & multimodalReal-time & multimodal

Actually best forSebenernya paling oke buat

Current news & live web infoBerita terkini & info web langsung
Google Workspace integrationIntegrasi Google Workspace
Multimodal — text, image, videoMultimodal — teks, gambar, video
Research with live citationsRiset dengan kutipan langsung
When data freshness is criticalKalau kesegaran data itu krusial

DimensionAspek	Claude	ChatGPT	Gemini
Empathy & nuanceEmpati & nuansa	✅ Genuinely strong — by design✅ Genuinely kuat — by design	⚠️ Warm tone, but sycophantic⚠️ Nada hangat, tapi cenderung sycophantic	➖ More clinical & factual➖ Lebih klinis & faktual
Data & long-doc analysisAnalisis data & dokumen panjang	✅ 200k context — advantage here✅ 200k konteks — unggul di sini	✅ Strong, 128k context✅ Kuat, 128k konteks	✅ Strong + live data access✅ Kuat + akses data langsung
Honest pushbackBerani koreksi kamu	✅ Will challenge bad ideas✅ Berani bilang ide kamu kurang bagus	⚠️ Tends to agree to please⚠️ Cenderung setuju biar kamu senang	✅ Fairly balanced✅ Cukup berimbang
Tool ecosystemEkosistem tools	Growing (MCP-based)Berkembang (berbasis MCP)	✅ Largest — plugins, DALL-E, voice✅ Terbesar — plugins, DALL-E, suara	✅ Native Google suite✅ Suite Google native

Real-world exampleContoh nyata

08 / 09

Same prompt, different results

Prompt sama, hasil beda

See the myth play out in practice — the "warm" platform and the "empathetic" platform are not always the same thing.

Lihat miskonsepsinya dalam aksi — platform yang "hangat" dan platform yang "empatik" itu nggak selalu platform yang sama.

Prompt A — Needs real empathy: "I need to write a sensitive email to a colleague who made a mistake in front of the team. Help me be honest but kind."

Prompt A — Butuh empati yang sesungguhnya: "Aku perlu nulis email ke rekan kerja yang bikin kesalahan di depan tim. Bantuin aku buat jujur tapi tetap baik."

Claude ✅

Considers the emotional stakes carefully. Offers multiple tones with reasoning behind each. Flags what might sting unintentionally. Asks clarifying questions. This is genuine empathy — understanding context deeply, not just sounding warm. Nimbang beban emosionalnya dengan serius. Kasih beberapa pilihan nada beserta alasannya. Ngingetin kalimat yang bisa nyakitin tanpa sadar. Tanya dulu kalau butuh konteks lebih. Ini empati yang sesungguhnya — bukan sekadar kedengarannya hangat.

ChatGPT ⚠️

Produces a polished, friendly-sounding draft quickly. Feels warm — but may not probe deeper emotional dynamics. More likely to validate your framing without questioning it. Agreeable tone ≠ genuine empathy. Langsung keluarin draf yang rapi dan terdengar ramah. Kesannya hangat — tapi mungkin nggak menggali dinamika emosional yang lebih dalam. Lebih mungkin memvalidasi framing kamu tanpa nanya dulu. Nada yang setuju ≠ empati yang nyata.

Gemini ➖

Provides a solid, structured draft. More clinical — may reference communication frameworks. Less attuned to the emotional subtext of the situation. Draf yang solid dan terstruktur. Lebih klinis — mungkin referensiin framework komunikasi. Kurang peka soal subteks emosional dari situasinya.

Prompt B — Research + current facts: "What are the latest AI regulations in the EU and how do they affect businesses?"

Prompt B — Riset + info terkini: "Apa regulasi AI terbaru di Uni Eropa dan gimana dampaknya ke bisnis?"

Claude ✅

Deep, nuanced analysis up to its training cutoff. Excellent at surfacing implications and edge cases. 200k context means it can digest a full legal document. Needs web search for truly live updates. Analisis mendalam dan bernuansa sampai batas training. Jago banget ungkap implikasi dan edge case. 200k konteks artinya bisa cerna dokumen hukum penuh. Butuh web search untuk update yang benar-benar terkini.

ChatGPT ✅

Strong analysis with browsing enabled. Plugin ecosystem useful for legal research. Can be overconfident on specifics — worth double-checking cited details. Analisis kuat kalau browsing aktif. Ekosistem plugin berguna buat riset hukum. Bisa terlalu PD soal detail tertentu — ada baiknya cek ulang fakta yang dikutip.

Gemini 🏆

Strongest here — native Google Search delivers real-time results with source links. Best choice when data freshness and citations are critical. This is Gemini's home turf. Paling unggul di sini — Google Search native kasih hasil real-time lengkap sama link sumbernya. Pilihan terbaik kalau kesegaran data dan kutipan itu krusial. Ini kandangnya Gemini.

The corrected rule of thumb: Use Claude when you need genuine depth — empathy, nuance, or careful analysis. Use ChatGPT when you need speed and the widest tool ecosystem. Use Gemini when you need what happened this week. And remember: how well you prompt matters more than which platform you pick.

Aturan praktis yang sudah diluruskan: Pakai Claude kalau butuh kedalaman sesungguhnya — empati, nuansa, atau analisis yang hati-hati. Pakai ChatGPT kalau butuh cepat dan ekosistem tools terlengkap. Pakai Gemini kalau butuh info minggu ini. Dan ingat: cara kamu nulis prompt jauh lebih nentuin hasilnya daripada platform yang kamu pilih.

Quiz timeKuis

09 / 09

Quick knowledge check

Yuk, cek seberapa nyantol!

8 questions covering everything in this session. Pick an answer — you'll get instant feedback and an explanation.

8 pertanyaan yang nyakup semua materi tadi. Pilih jawaban — langsung tau bener atau salah plus penjelasannya.

How Large LanguageModels actually work

Gimana sih Large LanguageModels itu bekerja?

The AI family — nested like Russian dolls

Keluarga besar AI — kayak boneka Matryoshka

How LLMs actually work

Sebenernya LLM itu ngapain aja sih?

What LLMs can and can't do

LLM itu jago ngapain, dan lemah di mana?

How and why LLMs fail

Cara dan alasan LLM bisa meleset

RAG & MCP — giving AI eyes and hands

RAG & MCP — ngasih AI mata dan tangan

Claude vs ChatGPT vs Gemini — busting myths

Claude vs ChatGPT vs Gemini — lurusin miskonsepsi

Same prompt, different results

Prompt sama, hasil beda

Quick knowledge check

Yuk, cek seberapa nyantol!

How Large Language
Models actually work

Gimana sih Large Language
Models itu bekerja?