%95'lik Basarisizlik Orani Gercek — Iste Nedeni
Istatistik abartili gorunuyor. Degil. Gartner'in 2025 Kurumsalda Yapay Zeka anketi, kurumsal yapay zeka ajan projelerinin yalnizca %4,8'inin 18 ay icinde olculebilir is degeri sagladigini ortaya koymustur. MIT Sloan'in boylamsal calismasi, 2023-2025 yillari arasinda 340 kurumsal yapay zeka girisimini izlemis ve "basarisizlik" su sekilde tanimlandiginda %94 basarisizlik orani rapor etmistir: uretime hic ulasamayan, devreye almadan sonraki alti ay icinde terk edilen veya 24 ay icinde pozitif ROI saglayamayan.
Ancak manset rakami, daha onemli bir icgoruyu gizler: basarisizlik nedenleri son derece tutarlidir. Rastgele degillerdir. Oncelikli olarak teknik degillerdir. Ve neredeyse tamamen onlenebilirlerdir.
85 basarisiz kurumsal yapay zeka ajan projesinin olum sonrasi analizini inceledigimizde — ki bunlarin 23'u kurtarmak icin gorevlendirildigimiz projelerdi — yedi kalip dikkat cekici bir duzenlilikle ortaya cikmistir. Her basarisiz proje bu kaliplarindan en az ucunu sergilemistir. Basarili %5'lik kesim yedisinin hepsinden kacinmistir.
Kaliplar uc kategoriye duser. Stratejik basarisizliklar (Kalip 1 ve 2) tek bir satir kod yazilmadan once gerceklesir — kapsam belirleme, problem tanimi ve beklenti yonetimi basarisizliklaridir. Muhendislik basarisizliklari (Kalip 3, 4 ve 5) uygulama sirasinda gerceklesir — geleneksel yazilim gelistirme pratiklerini, belirleyici olmayan yapay zeka sistemlerinin temelden farkli gercekligine uyarlama basarisizliklaridir. Operasyonel basarisizliklar (Kalip 6 ve 7) lansmandan sonra gerceklesir — yapay zeka ajan operasyonlarini uzun vadede surdurmek, izlemek ve kadrolama basarisizliklaridir.
Asagida aktarilan teori degil. Bunlar gercek projelerden cikarilmis, spesifik teshis kriterleri ve somut karsi onlemleri olan kaliplardir. Kurumsal bir yapay zeka ajani devreye almasi planliyorsaniz, bunu ucus oncesi kontrol listesi olarak kullanin. Zorlanan bir projenin ortasindaysaniz, teshis cercevesi olarak kullanin.
Kalip 1: Is Problemini Degil, Demo Problemini Cozmek
En sinsi basarisizlik kalibi basarili bir demo ile baslar. Bir ekip iki haftada etkileyici bir prototip olusturur — musteri sorularini yanitleyan, belgeleri ozetleyen veya destek taleplerini triaj eden bir ajan. Yonetim etkilenir. Butce onaylanir. Proje "uretime" gecis yapar.
Sonra gerceklikle yuzyuze gelinir. Demo 50 dikkatle secilmis ornek uzerinde calismistir. Uretim, ayda 50.000 daganik, belirsiz, celiskili ve uc vaka dolu gercek etkilesim demektir. Demo Ingilizce metin girdisini islemistir. Uretim, cok dilli sorgular, ekler, ekran goruntuleri ve sesli mesajlar anlamina gelir. Demo temiz veri varsaymistir. Uretim, tekrarlanan kayitlar, guncel olmayan bilgiler, eksik alanlar ve celisen kaynaklar anlamina gelir.
Buna demodan-uretime ucurumu diyoruz ve bu ucurum genellikle ekiplerin beklediginden 10-20 kat daha genistir. Kontollu bir ortamda sergilenen yetenekler, uretim devreye almasi icin gereken muhendislik isinin belki %5-10'unu temsil eder. Kalan %90 — hata yonetimi, uc vakalar, guvenlik, izleme, entegrasyon, uyumluluk — demoda gorunmez ama devreye almayi basarili veya basarisiz kilar.
Teshis sorusu: Ekibiniz bu ajanin tam olarak hangi is KPI'sini, ne kadar hareket ettireceginizi ve bunu nasil olcecegini net olarak ifade edebiliyor mu? Cevap belirsizse — "musteri deneyimini iyilestirmek" veya "verimliligi artirmak" — demo problemini cozuyorsunuz demektir.
Karsi onlem: Tek bir prompt yazmadan once, mevcut is akisini haritalayan, ajanin ele alacagi spesifik darbogazni veya maliyet merkezini belirleyen, mevcut taban cizgisini sayisallastiran ve olculebilir bir hedef tanimlayan bir Is Sureci Analizi (ISA) tamamlayin. Korvus Labs'ta, kesif asamasimiz muhendislik baslamadan once her paydas tarafindan imzalanan tek sayfalik bir Is Etki Kanvasi uretir. Kanvas yok, kod yok.
Basarili olan ekipler, en etkileyici demolara sahip olanlar degildir. "Bu ajan mukemmel sekilde calisirsa, gelir tablosundaki hangi spesifik rakam degisir?" sorusunu yanitleyen ekiplerdir.

Kalip 2: Ajanlari Belirleyici Yazilim Gibi Ele Almak
Bu kalip, diger herhangi bir tek nedenden daha fazla kurumsal yapay zeka projesini oldurur. Ekipler, SDLC'nin temel varsayimlari olan belirleyici davranis, tekrarlanabilir ciktilar ve ikili gecti/kaldi testinin gecerli olmadigini fark etmeden geleneksel yazilim gelistirme yasam dongusu (SDLC) pratiklerini yapay zeka ajani gelistirmeye uygular.
Geleneksel yazilim belirleyicidir: ayni girdiye her seferinde ayni ciktiyi uretir. Yapay zeka ajanlari olasiliklidir: ayni girdi, farkli cagrilarda, model versiyonlarinda ve hatta sicaklik > 0 olan ayni API cagrilarinda farkli ciktilar uretebilir. Bu tek fark, kurumsal muhendislik ekiplerinin guveni olan test, devreye alma ve izleme pratiklerinin cogunu gecersiz kilar.
Test ikili gecti/kaldi olamaz. Bir yapay zeka ajaninin "Iade politikaniz nedir?" sorusuna verdigi yanit oz olarak dogru olabilir ancak ifade, ton ve yapi bakimindan cagrilar arasinda farklilik gosterebilir. Geleneksel assert tabanli test hemen bozulur. Tam metin eslestirme degil — dogruluk, tamlil, ton ve guvenlik uzerinde rubrik tabanli degerlendirme ile ciktilari puanlayan degerlendirme cercevelerine ihtiyaciniz vardir.
Devreye alma basit geri alma ile mavi-yesil olamaz. Bir promptu guncellediginizde, bir modeli degistirdiginizde veya bir RAG hattini degistirdiginizde, etki birim testlerinden ongorebilemeyeceginiz sekillerde binlerce olasi etkilesime yayilir. Gercek zamanli degerlendirme, istatistiksel anlamlilik testi ve kalite puani dagilimlarina dayali otomatik geri alma tetikleyicileri ile kanarya devreye almalarinin ihtiyaciniz vardir.
Izleme hata oranlarira ve calisma suresine dayanamaz. Bir yapay zeka ajani 200 ms yanit suresi ve %0 hata oranivla "calisir" durumda olabilir ve ayni zamanda halusinasyon yapan, zararli veya yanlis ciktilar uretebilir. Semantik izlemeye ihtiyaciniz vardir: her etkilesimin bir ornekleminde otomatik kalite degerlendirmesi, girdi dagilimlari uzerinde sapma tespiti ve uc vakalar icin insan inceleme hatlari.
Karsi onlem: Yapay zeka ajanlarini devreye alinmis eserler degil, canli sistemler olarak ele alan bir AgentOps metodolojisi benimseyin. Bu, degerlendirme odakli gelistirme (test odakli degil), olasilikli devreye alma stratejileri ve surekli semantik izleme anlamina gelir. Teknik ekibimiz, her devreye almaya uyguladigimiz kurumsal baglamlar icin ozellestirilmis bir AgentOps cercevesi gelistirmistir.
Kalip 3: Entegrasyon Karmasikligini 3 Kat Hafife Almak
Entegrasyon, bir yapay zeka ajaninin oyuncak mi yoksa arac mi oldugunu belirleyen gosterissiz bir istir. Ve tutarli olarak 3 kat hafife alinir.
Temel neden, yapay zeka projelerine ozgu bir planlama yanilsamasidir. Ekipler, baglanmalari gereken sistemlerin API dokumantasyonuna dayanarak entegrasyonu tahmin eder. SAP BAPI dokumantasyonu, bir fatura kaydi olusturmanin tek bir API cagrisi oldugunu ima eder. Salesforce REST API, kayit olusturmayi onemsiiz gosterir. Zendesk API, talep yonetimi icin net ucnoktalar sunar.
Ancak uretim entegrasyonu asla tek bir API cagrisi degildir. Su unsurlari icerir: birden fazla sistemde kimlik dogrulama ve token yonetimi. Uyumsuz semalar arasinda veri donusumu. Alt sistem arizalari icin hata yonetimi. Idempotansi garantili yeniden deneme mantigi. Hiz sinirlandirma ve geri basinc yonetimi. Her sistem arasi islem icin denetim kaydi. Donusum oncesi ve sonrasi veri dogrulama. Her yeni baglanti icin guvenlik incelemesi ve penetrasyon testi.
Bu kaygialrin her biri muhendislik zamanini, "mutlu yol" API cagrisina gore 3-5 kat arttirir. Uc kurumsal sistemle (tipik bir minimum) entegre olan bir yapay zeka ajani icin entegrasyon muhendislik is yuku 600-1.200 saattir — cogu proje planinin ayirdigi 200-400 saat degil.
Birlesen faktor, yapay zeka ajani entegrasyonunun geleneksel uygulama entegrasyonunun sahip olmadigini ek bir karmasiklik katmanina sahip olmasidir: ajanin ciktilari belirleyici olmadigindan, hata yonetimi teknik olarak gecerli ancak anlamsal olarak yanlis ciktilari hesaba katmalidir. Bir ajan, gecersiz bir maliyet merkezi koduyla sozdizimsel olarak dogru bir SAP BAPI cagrisi olusturabilir. Geleneksel hata yonetimi sozdizimi hatalarini yakalar; yapay zekaya ozgu hata yonetimi, dogrulama kurallari, is mantigi kontrolleri ve guven esikleri araciligiyla anlamsal hatalari yakalamalidir.
Karsi onlem: Planlama sirasinda uretilen herhangi bir entegrasyon tahminine 3 kat carpan uygulayin. Toplam proje maliyetinin %35-45'ini entegrasyon icin butcelayin. Bir zaman cizelgesine bagli kalmadan once her hedef sistemin gercek API davranisina 2-3 gunluk derin dalis yapan teknik bir spike gerceklestirin. Ve proje planinizi, entegrasyon isinin "yapay zeka kisminin" bitmesinden sonra degil, ilk haftada basayacak sekilde yapilandirin.
TSM analizimizde ayrintilari verdigimiz uzere, entegrasyon kurumsal yapay zeka ajani devreye almalarinda en buyuk tek maliyet kategorisidir. Dogru planlamak, proje liderinin alabilecegi en yuksek kaldrac etkisine sahip adimdir.
Kalip 4: Ilk Gunden Insan Gozetimi Tasarimi Olmamasi
Kurumsal yapay zeka ajanlari, hatalarin sonuclari olan ortamlarda calisir — finansal, hukuki, itibarsal. Yanlis garanti bilgisi veren bir musteri destek ajani yasal sorumluluk yaratir. Yanlis defteri kebir hesabina kaydeden bir fatura isleme ajani denetim bulgulari yaratir. Onyargi gosteren bir ise alim tarama ajani ayrimcilik davalari yaratir.
Bu risklere ragmen, basarisiz yapay zeka ajan projelerinin cogunlugu insan gozetimini sonradan dusunulen bir sey olarak ele alir — cekirdek ajan calistiktan "sonra eklenecek" bir sey. Bu yaklasim iki nedenden dolayi basarisiz olur.
Birincisi, insan-in-the-loop (HITL) kaliplarini mevcut bir ajan mimarisine sonradan eklemek, basindan itibaren tasarlamaktan 3-5 kat daha pahaliydir. HITL, ustune civiladiginiz bir ozellik degildir. Veri akisini, durum yonetimini, kullanici arayuzu tasarimini ve operasyonel is akislarini etkileyen bir mimari kaliptir. Tam otonomi icin tasarlanmis bir ajan ile gozetimli otonomi icin tasarlanmis bir ajan temelden farkli mimarilere sahiptir.
Ikincisi, HITL tasarimi, aksi takdirde uretime kadar cozumsuz kalan kritik sorulari erken yanitlemanizi saglar: Hangi guven esigi insan incelemesini tetikler? Eskalasyon yapilan kararlari kim inceler ve yanit suresi SLA'si nedir? Insan duzeltmeleri ajanin ogrenme dongusune nasil geri beslenir? Insan incelemeci mevcut olmadiginda ne olur? Bu sorular tum sistem tasarimini sekillendirmesi ve erken yantilanmasi maliyetli mimari pivotlari onler.
AB Yapay Zeka Yasasi bunu daha da tartismasiz kilar. Madde 14, yuksek riskli yapay zeka sistemleri icin insan operatorlerinin "yapay zeka sisteminin kapasitelerini ve sinirlamalarini anlamasini," "sistemin ciktisini dogru yorumlamasini" ve "sistemi kullanmama veya ciktisini gecersiz kilma kararini vermesini" saglayan "uygun insan gozetim onlemleri" gerektirir.
Karsi onlem: Ilk promptunuzu yazmadan once HITL stratejinizi tanimlayin. Farkli risk profilleri ve operasyonel baglamlara uygun dort kanitlanmis kaliptan birini onriyoruz — Onay Gecidi, Guven Yonlendirmesi, Paralel Isleme veya Eskalasyon Kaskadi. Insan gozetimi kilavuzumuz her kalip icin ayrintili mimari diyagramlari sunmaktadir.
Ilk gunden HITL tasarlayan projeler uretime ulasma olasiliginin 4 kati daha yuksektir. Teknoloji daha iyi oldugundan degil, HITL'in yantilamanizi zorunlu kildigi organizasyonel ve operasyonel sorular, bir ajanin uretime hazir olup olmadiginii belirleyen ayni sorular oldugundan.

Kalip 5: Uyumlulugu Devreye Alma Gunune Kadar Gormezden Gelmek
Bu senaryonun en az on iki kez yasandigina tanik olduk: bir ekip alti ay boyunca bir yapay zeka ajani insa eder, devreye alma asamasina ulasir ve sonra hukuk, uyumluluk veya DPO'nun temel mimari degisiklikler gerektiren endiseler tasidigi ortaya cikar. Proje, uyumluluk gereksinimleri geriye donuk olarak uygulanirken 3-6 ay durur — basindan itibaren olusturmanin maliyetinin 3-5 katina.
Agustos 2025'ten itibaren tam olarak uygulanabilir olan AB Yapay Zeka Yasasi, uyumlulugu devreye alma kontrol listesi kaleminden mimari bir gereksinime donusturmustur. Risk siniflandirmasi hangi teknik kontrollerin zorunlu oldugunu belirler. Dokumantasyon gereksinimleri ajan kararlarini nasil kaydettginizi, saklayip denetlediginizi etkiler. Seffaflik yukumlulukleri yapay zeka tarafindan uretilen ciktilari son kullanicilara nasil sundugunuzu etkiler.
KVKK/GDPR zorlugun birlestirir. Yapay zeka ajaniniz kisisel veri isliyorsa — ve neredeyse her kurumsal ajan isliyordur — otomatik karar almanin spesifik risklerini degerlendiren bir Veri Koruma Etki Degerlendirmesi (DPIA) gerekir. GDPR Madde 22, bireylere hukuki veya benzer olcude onemli etkilere sahip tamamen otomatik kararlara tabi olmama hakkini verir; bu da ajan mimarinizin belirli karar kategorileri icin insan inceleme mekanizmalari icermesi gerektigini anlamina gelir.
Gec uyumlulugun mali etkisi ciddidir. Proje basinda yapildiginda 10.000-25.000 EUR'ya mal olmasi gereken bir risk siniflandirmasi, devreye almada yapildiginda 40.000-80.000 EUR'ya mal olur, cunku tum sistemde dalga dalga yayilan mimari degisiklikleri tetikler. Planlama asamasinda 8.000-20.000 EUR'ya mal olan bir DPIA, yeniden tasarlanmasi gereken veri akislarini ortaya cikardiginda 30.000-60.000 EUR'ya mal olur.
Karsi onlem: Veri Koruma Gorevlinizi ve hukuk/uyumluluk ekibinizi devreye alma incelemesine degil proje baslangicina dahil edin. Birinci haftada risk siniflandirmasi yapin. Entegrasyon muhendisligi baslamadan once DPIA'yi tamamlayin. Uyumluluk gereksinimlerini sistem tasarimini sekillendiren mimari kisitlamalar olarak ele alin, yayina alma oncesi kontrol kutulari olarak degil.
Basindan itibaren uyumlulugu entegre eden kuruluslar yalnizca maliyetli geriye donuk uyarlmadan kacinmakla kalmaz — ayni zamanda daha guvenilir, daha denetlenebilir ve kurumsal yonetisim standartlariyla daha uyumlu ajanlar olusturur. Yapay Zeka yonetisim cercevemiz adim adim uyumluluk entegrasyon sureci sunmaktadir.
Kalip 6: Lansman Sonrasi AgentOps Stratejisinin Olmamasi
Bir yapay zeka ajaninin uretime ulastigi an bitis cizgisi degil — baslangicc cizgisidir. Yine de kurumsal yapay zeka projelerinin cogunlugu butce ve dikkatlerinin %90'ini lansman oncesi faaliyetlere tahsis eder ve lansman sonrasi operasyonlari sonradan dusunulen bir sey olarak ele alir.
Yapay zeka ajanlari uretimde bozulur. Bu bir risk degil — kesinliktir. Bozulma, yapay zeka sistemlerine ozgu ve geleneksel yazilimda karsiligi olmayan birden fazla mekanizma araciligiyla gerceklesir.
Model sapmasi LLM saglayicisi modelini guncellediginde gerceklesir. OpenAI, Anthropic ve Google uretim modellerini yilda birden cok kez gunceller ve her guncelleme, dikkatli ayarlanmis promptlari bozabilecek sekilde davranisi ince olcude degistirir. Claude 3.5 Sonnet uzerinde %92 gorev tamamlama orani elde eden bir prompt, promptun kendisinde herhangi bir degisiklik olmadan sonraki bir model versiyonunda yalnizca %78 saglayabilir.
Veri sapmasi ajaninizin karsitastigi gercek dunya verileri, tasarlandigi ve test edildigi verilerden saptiginda gerceklesir. Musteri sorgulan evrilir. Urun kataloglari degisir. Is kurallari guncellenir. Ajaninizin bilgi tabani ve promptlari bunlarla birlikte gelismezse, dogruluk hafta hafta duser.
Uc vaka birikimi uzun kuyruk problemidir. Ajaniniz etkilesimlerin %2-5'i oraninda yeni durumlarla karsilasir. Aylar icinde bu uc vakalar, ilk test sirasinda gorunmeyen onemli bir basarisizlik yuzeyine birikir. Sistematik uc vaka tespiti ve cozumu olmadan basarisizlik orani birikerek artar.
Mali etki olculebilirdir. AgentOps stratejisi olmadan devreye alinan bir ajan, genellikle 90 gun icinde gorev tamamlama oraninda %15-25 dusus yasir. Ayda 3.000 talep isleten bir musteri operasyonlari ajani icin %20'lik bir dusus, insan temsilcilere yonlendirilen ayda 600 ek talep anlamina gelir — beklenen tasarruflardan yaklasik aylik 18.000 EUR'nun silinmesi.
Karsi onlem: Her etkilesimin bir ornekleminde otomatik kalite degerlendirmesi, mevcut performansi temel cizgiyle karsilastiran haftalik sapma raporlari, uc vaka tespiti, siniflandirmasi ve cozumu icin sistematik bir surec, saglayici duyurulariyla tetiklenen model gecis testleri ve aylik prompt optimizasyon dongularini iceren bir AgentOps pratigi olusturun. Yapay zeka ajan degerini zaman icinde surdurenler, AgentOps'u gecici bir proje asamasi degil — kalici bir operasyonel fonksiyon olarak ele alanlardir.
Kalip 7: Ajan Gelistirme Icin Yanlis Ekip Yapisi
Son kalip teknik degil organizasyoneldir, ancak en temel olani olabilir. Kurumsal yapay zeka ajani gelistirme, cogu kurulusun sahip olmadiogini ve olusturmakta zorlandigi bir ekip yapisi gerektirir.
Tipik basarisizlik modu, bir yapay zeka ajan projesini bir veri bilimi ekibiyle — veya daha kotusu, tek bir "yapay zeka muhendisi" ile — kadrolayip onlardan bir uretim sistemi sunmalarini beklemektir. Veri bilimciler model gelistirme, deney ve analizde mukemmeldir. Genellikle uretim sistem muhendisligi, kurumsal entegrasyon, uyumluluk dokumantasyonu veya degisim yonetiminde deneyimli degildirler. Yalnizca veri bilimcilerle kadrolanmis bir yapay zeka ajan projesi, uretime asla ulasamayan parlak bir prototip uretecektir.
Kurumsal yapay zeka ajani gelistirme icin basarili ekip yapisi dort ayri yetkinlik icerir ve kritik olarak, dordu de baslangictan itibaren mevcut olmalidir — sirali olarak eklenmemelidir.
ML/Yapay Zeka Muhendisleri (2-3 kisi) prompt muhendisligi, model secimi, RAG hatti gelistirme, degerlendirme cercevesi tasarimi ve AgentOps'un sahibidirler. LLM'lerin olasilikli dogasini anlar ve belirleyici olmayanliklarini hesaba katan sistemler tasarlayabilirler.
Alan Uzmanlari (1-2 kisi) ajanin otomatiklestirdigi is akisini anlayan is sureci sahipleridir. Basari kriterlerini tanimlar, ajan ciktilarini is gercekligine karsi dogruler ve teknik yetkinlik ile is degeri arasinda kopru gorevi gorurler. Cekirdek ekipte alan uzmanligi olmadan, ajanlar yanlis problemi cozer (Kalip 1).
Entegrasyon Muhendisleri (2-3 kisi) ajan ile kurumsal sistemler arasindaki baglanti katmaninin sahibidirler. ERP API'leri, veri hatti muhendisligi, guvenlik saglamlastirma ve uretim altyapisi konusunda uzmanlik getirirler. Ozel entegrasyon muhendisligi olmadan projeler Kalip 3'e duser.
Uyumluluk Uzmanlari (0,5-1 kisi, projeler arasinda paylasilabilir) AB Yapay Zeka Yasasi siniflandirmasi, KVKK/GDPR degerlendirmesi, dokumantasyon ve denetim izi tasariminin sahibidirler. Uyumlulugun devreye almada geriye donuk uygulama yerine basindan itibaren entegre edilmesini saglarlar (Kalip 5).
Tek bir yapay zeka ajan projesi icin bu 6-9 kisilik ekip buyuk gorunebilir. Ancak alternatif — bu yetkinliklerden bir veya daha fazlasini icermeyen daha kucuk bir ekip — neredeyse her zaman eksik kadrolanmis alanda basarisizliga yol acar. Onerdigimiz satici secim kriterleri, bir danismanlik firmasinin dort yetkinligin tamamini mi yoksa yalnizca bir alt kumesini mi saglayabildigini degerlendirmeyi icerir.
Karsi onlem: Projenizi ilk gunden dort yetkinligin tamamiyla kadrolayin. Bu ekibi sirket ici olarak olusturamiyorsaniz, eksik yetkinlikleri saglayan bir danismanlik firmasiyla ortak olun — ancak kara kutu olarak calisamk yerine ic ekibinizle entegre olmalarina dikkat edin.
Risk Azaltma Cercevesi: Pratik Kilavuz
Yedi kalibi bilmek degerlidir. Bunlari onlemek icin sistematik bir surece sahip olmak ise uygulanabilirdir. Iste Korvus Labs'ta her kurumsal yapay zeka ajan calismasina uyguladigimiz risk azaltma cercevesi.
Asama 0: Ucus Oncesi Kontrol (Hafta 0) Herhangi bir muhendislik kaynagi ayirmadan once, yedi ikili soruyu yantilayin — her basarisizlik kalibi icin bir tane:
- Bu ajanin hareket ettirecegi spesifik is KPI'sini sayisal bir hedefle ifade edebiliyor muyuz? (Kalip 1)
- Muhendislik ekibimiz AgentOps pratiklerini — degerlendirme odakli gelistirme, olasilikli devreye alma, semantik izleme — benimsedi mi? (Kalip 2)
- Her entegrasyon hedefinde teknik spike'lar yapip entegrasyon tahminlerine 3 kat carpan uyguladik mi? (Kalip 3)
- Ilk promptumuzu yazmadan once bir insan gozetimi kalibini secip tasarladik mi? (Kalip 4)
- DPO'muz/uyumluluk ekibimiz projeye birinci haftadan itibaren katiliyor mu? (Kalip 5)
- Lansman sonrasi 1-12. aylar icin fonlanmis, kadrolanmis bir AgentOps planmiz var mi? (Kalip 6)
- Ekibimiz ML muhendisleri, alan uzmanlari, entegrasyon muhendisleri ve uyumluluk uzmanlarini iceriyor mu? (Kalip 7)
Herhangi bir cevap "hayir" ise, devam etmeden once cozun. Projeye cozulmemis teknik borc olarak giren her "hayir" zamanla bilesik olarak buyur.
Asama 1: Kapsamli Deger Kaniti (Hafta 1-3) Tek, iyi tanimlanmis bir alt is akisini ele alan dar bir ajan olusturun. Demo degil — gercek sistem entegrasyonu, gercek veri, gercek uyumluluk kontrolleri ve gercek insan gozetimi iceren dikey entegre bir dilim. Asama 0'da belirlenen taban cizgisine karsi gorev tamamlama orani, dogruluk, isleme suresi ve kullanici memnuniyetini olcun.
Asama 2: Saglamlastirilmis Uretim Ajani (Hafta 4-6) Ajanin kapsamini sistematik olarak genisletin, is akislarini birer birer ekleyin. Her genisleme ayni entegrasyon, test, uyumluluk ve HITL tasarim surecinden gecer. Kanarya yonlendirmesiyle devreye alin: baslangicta trafigin %10'u, kalite metriklerine gore genisletilerek.
Asama 3: Surdurulebilir Operasyonlar (Ay 2+) Proje modundan operasyonel moda gecis yapin. AgentOps ekibi (ister dahili ister Korvus Labs gibi bir ortakla) izleme, optimizasyon, model gecisi ve surekli iyilestirmenin sahipligini ustlenir.
Bu cerceve riski ortadan kaldirmaz — hicbir cerceve bunu yapamaz. Ancak riski, en ucuza cozulebildigi erken asamada ortaya cikarir; en pahali oldugu gec asamada degil. Bu cerceveyi izleyen ekipler, tutarli olarak basarili olan %5'lik keside yer alir.
Ayrintili hafta hafta uygulama kilavuzu icin alti haftalik yol haritamiza bakin.
