10 Praktik Terbaik yang Terbukti untuk Membangun Agen AI yang Andal pada tahun 2025
Di UiPath, kami telah menjalani pola pikir agen selama beberapa waktu. Kami tidak hanya membuat demo; kami membangun agen yang mengirimkan, meningkatkan skala, dan bertahan dari kekacauan perusahaan yang nyata.
Jika Anda pernah memasukkan model bahasa besar (LLM) ke dalam produksi, Anda pasti tahu:bukan perintahnya yang rusak. Semuanya ada di sekitar mereka. Penanganan kesalahan, manajemen konteks, kontrak alat, ketertelusuran. Itu sebabnya kami membangun UiPath Agent Builder di Studio seperti yang kami lakukan. Kami ingin memberi Anda kontrol dan kemampuan observasi yang Anda perlukan agar agen AI berfungsi seperti komponen perangkat lunak nyata.
Inilah yang telah kami pelajari dalam membangun, menguji, dan mengirimkan otomatisasi agen dalam skala besar. Ini adalah praktik terbaik pembuat agen yang akan membantu Anda beralih dari “berhasil” menjadi “hal ini berjalan dalam produksi tanpa membangunkan saya pada jam 2 pagi”.
1. Agen desain yang gagal dengan aman (tidak hanya cepat)
-
Integrasikan agen dengan cermat dalam otomatisasi:hindari menyematkan agen di dalam REFramework kecuali Anda memiliki kasus penggunaan yang sangat kuat. Agen memperkenalkan variabel (misalnya eskalasi, penanganan kesalahan) yang harus dikelola dengan hati-hati. Sebaliknya, UiPath Maestro™ direkomendasikan untuk visibilitas dan kontrol yang lebih baik.
-
Hindari mekanisme percobaan ulang untuk agen:keluaran agen tidak bersifat deterministik, oleh karena itu percobaan ulang tidak menjamin peningkatan. Sebaliknya, tangkap dan tangani kesalahan dalam agen atau alat itu sendiri.
-
Mulailah dari hal yang kecil dan terfokus:mulai dengan agen dengan tanggung jawab tunggal; masing-masing dengan satu tujuan yang jelas dan cakupan yang sempit. Perintah yang luas mengurangi akurasi; cakupan yang sempit memastikan kinerja yang konsisten.
-
Modularisasikan ke dalam beberapa agen khusus:bangun sistem modular dengan menggabungkan agen dan robot untuk alur kerja yang kompleks, bukan hanya satu agen yang “melakukan segalanya”. Hal ini memungkinkan penskalaan yang terkontrol, proses debug yang lebih mudah, dan penggunaan kembali yang fleksibel.
-
Untuk tugas-tugas deterministik, gunakan alat:risiko terikat dengan memanggil otomatisasi atau API UiPath yang telah terbukti sebagai alat daripada membiarkan agen bertindak langsung, ketika kasus penggunaan menuntutnya. Hal ini meningkatkan prediktabilitas dan keamanan.
-
Menyelaraskan tujuan agen dan hasil yang terukur:tentukan tujuan yang jelas, metrik kinerja, dan kriteria keberhasilan sebelum desain dimulai. Agen harus beroperasi dalam batasan yang terukur.
2. Konfigurasikan konteks dengan cara yang benar
-
Indeks konteks perusahaan Anda:indeks sumber terstruktur, basis pengetahuan (KB), dan dokumentasi yang akan diandalkan oleh agen Anda. Perencanaan yang baik dan pengaturan konteks adalah kunci pelaksanaan yang andal. Pastikan Anda memilih strategi pencarian yang tepat. Pencarian semantik menemukan kecocokan berdasarkan makna dalam teks tidak terstruktur dan pencarian terstruktur mengambil data yang tepat dari skema yang ditentukan. DeepRAG menggabungkan keduanya untuk memberikan alasan yang mendalam pada sumber-sumber yang besar, kompleks, atau campuran.
-
Pilih model yang tepat:UiPath Agent Builder di Studio bersifat agnostik model, oleh karena itu gunakan model yang paling sesuai dengan kasus penggunaan Anda. GPT-5, misalnya, umumnya lebih andal dibandingkan GPT-4. Gunakan model evaluasi yang berbeda dengan model agen itu sendiri untuk menghindari bias.
-
Pertahankan kejelasan dalam definisi alat:gunakan nama alat yang deskriptif dan sederhana dengan karakter alfanumerik huruf kecil dan tanpa spasi atau karakter khusus. Nama harus sama persis dengan apa yang dirujuk dalam perintah.
3. Perlakukan setiap kemampuan sebagai alat
-
Perlakukan setiap kemampuan eksternal sebagai sebuah alat:alat tersebut harus memiliki kontrak input/output yang ketat dan kriteria keberhasilan yang jelas. Gunakan kembali otomatisasi UiPath sebagai alat bila memungkinkan.
-
Perintah berdasarkan skema:jaga agar perintah alat tetap ringkas dan terstruktur. Validasi bentuk keluaran dan tangani hasil nol atau kosong secara eksplisit.
-
Alat dokumen dan versi:pertahankan riwayat pembuatan versi dan evaluasi yang jelas per alat. Evaluasi tautan berjalan ke versi tertentu.
-
Bangun alat untuk meningkatkan keandalan agen untuk tugas-tugas deterministik:LLM tidak pandai matematika, membandingkan tanggal, dll. Untuk menghindari masalah apa pun dengan keandalan agen, buat alat yang melakukan operasi kompleks.
4. Tulis perintah seperti spesifikasi produk (bukan prosa)
-
Desain dan pengujian berulang:rekayasa cepat adalah proses yang berulang, jadi gunakan UiPath Agent Builder untuk menyempurnakan perintah sistem dan instruksi tugas Anda dengan membuat rangkaian evaluasi dan pengujian yang tepat saat Anda membangun.
-
Mulailah dengan prompt sistem yang mendefinisikan:
-
Gunakan penalaran terstruktur dan multi-langkah:gabungkan penalaran gaya rantai pemikiran untuk alur kerja yang kompleks. Tentukan secara eksplisit dekomposisi tugas, metode penalaran, dan format keluaran.
-
Bersikaplah spesifik dan sedetail mungkin tentang hasil yang diinginkan agen Anda:pastikan Anda menentukan skema keluaran yang tepat dari argumen keluar Anda di UiPath Data Manager. Memberikan contoh juga membantu.
-
Jelaskan apa yang seharusnya terjadi dan apa yang tidak boleh terjadi:Inilah perbedaan antara meminta agen AI Anda dengan “JANGAN meminta informasi pribadi” dan “Hindari meminta informasi pribadi, alih-alih rujuk pengguna ke…”.
-
Pertimbangkan petunjuk berbeda untuk menyelesaikan tugas yang sama:model memiliki perilaku implisit yang berbeda. Misalnya, kecenderungan untuk memunculkan kesalahan ketika tidak pasti, sehingga memerlukan instruksi per model yang spesifik.
-
Gunakan rangkaian evaluasi untuk membantu menyempurnakan perintah:bereksperimenlah dengan model dan perintah dengan alat pengoptimalan cepat.
-
Gunakan bahasa Markdown:menggunakan bahasa ini memungkinkan Anda untuk menekankan aspek-aspek tertentu dalam prompt Anda. Contoh:* *Kritis:* *
-
Hindari merujuk argumen masukan di prompt berdasarkan nilainya:misalnya, {{input}}, karena nilai tersebut akan diganti saat runtime dengan nilai argumen sebenarnya.
Ingin mengembangkan keterampilan cepat Anda? Akademi UiPath menyediakan kursus "Cara menulis perintah yang lebih baik" dan "Rekayasa perintah agen" untuk Anda.
5. Evaluasi untuk dunia nyata
-
Bangun kumpulan data evaluasi yang kuat:miliki setidaknya 30 kasus evaluasi per agen. Simulasikan alat dan eskalasi yang dapat memblokir proses berjalan. Sertakan kasus sukses, kasus edge, dan skenario kegagalan.
-
Evaluasi secara menyeluruh dan mendalam:mencakup berbagai dimensi—akurasi hasil, penalaran, kemampuan penelusuran, kemampuan beradaptasi, dan keberhasilan penggunaan alat.
-
Pengujian menyeluruh:mengevaluasi agen dalam konteks otomatisasi penuh, tidak hanya secara terpisah. Uji integrasi, komunikasi, pemulihan, dan mode kegagalan.
-
Gunakan penelusuran:tinjau Log Jejak secara berkala untuk memeriksa alur pemikiran agen, keputusan, dan penggunaan alat. Identifikasi kesalahan, inefisiensi, dan perilaku tak terduga.
-
Metrik dan tata kelola:melacak skor kesehatan dan metrik regresi, dan menerbitkan gerbang pada ambang batas kelulusan.
6. Keamanan, tata kelola, dan kepatuhan bawaan
-
Jalankan agen melalui UiPath Orchestrator atau Maestro:terapkan agen sebagai proses untuk mewarisi manajemen siklus hidup, audit, dan tata kelola.
-
Manfaatkan AI Trust Layer:terapkan izin per grup, redaksi PII, log audit, pembatasan, dan kontrol penggunaan.
-
Pertahankan keterlibatan manusia:gunakan eskalasi untuk melakukan tinjauan manusia terhadap keputusan-keputusan yang berisiko tinggi. Interaksi ini menginformasikan memori agen, sehingga meningkatkan proses di masa depan.
-
Gunakan pagar pembatas:tetapkan dan terapkan aturan untuk perilaku dan eskalasi yang dapat diterima.
7. Versi yang disengaja dan rilis gerbang
-
Versi semuanya:pertahankan kontrol versi yang jelas untuk perintah, alat, kumpulan data, dan evaluasi.
-
Pelepasan produksi gerbang:memindahkan agen ke produksi hanya setelah evaluasi lulus dan rencana peluncuran diselesaikan.
-
Lampirkan evaluasi ke tag versi:pastikan ketertelusuran mulai dari desain hingga penerapan.
8. Rancang percakapan yang membangun kepercayaan
-
Tetapkan ekspektasi yang jelas:komunikasikan apa yang bisa dan tidak bisa dilakukan agen. Menyediakan tindakan alat yang transparan dan jalur eskalasi manusia/robot yang jelas.
-
Konfirmasikan tindakan yang tidak dapat diubah:gunakan konfirmasi deterministik (“Saya akan membuat bidang X dengan Y — lanjutkan?”).
-
Desain untuk transparansi:tampilkan konteks atau cuplikan alasan jika diperlukan untuk membangun kepercayaan.
9. Kontrol biaya dan kinerja tanpa mengorbankan kualitas
-
Optimalkan penggunaan model:sesuaikan pilihan model Anda (model besar untuk alasan yang kompleks, model yang lebih kecil untuk klasifikasi atau perutean).
-
Batasi penggunaan token:pertahankan fokus pengambilan, rangkum konteks yang panjang, dan simpan respons yang stabil.
-
Operasi batch dan tingkat:mengelompokkan panggilan berisiko rendah dan hanya melakukan eskalasi bila diperlukan ke model berkemampuan lebih tinggi.
10. Tingkatkan terus-menerus dengan jejak, memori, dan masukan manusia
-
Lacak dan pelajari:gunakan kemampuan penelusuran dan evaluasi di Agent Builder untuk meningkatkan keandalan secara berulang. Gunakan memori agen untuk membantu agen AI belajar dari eskalasi yang diselesaikan oleh manusia.
-
Putaran umpan balik manusia:eskalasi, umpan balik evaluasi, dan log proses harus dimasukkan kembali ke dalam pembaruan desain serta memori agen.
-
Skalakan secara bertahap:perluas kemampuan agen hanya setelah stabilitas dan kinerja terbukti pada skala yang lebih kecil.
Siap membangun agen produksi pertama Anda?
Mulailah dengan Agent Builder atau lihat demo langsung.
Untuk pengembang, kami telah menyediakan semua yang perlu Anda ketahui tentang berbagai cara untuk membangun dan menyebarkan agen di satu tempat yang nyaman. Mulai di sini .
FAQ:Pembuat Agen dan agen AI
Apa itu pembuat agen?
Pembuat agen adalah lingkungan pengembangan yang memungkinkan Anda merancang, mengonfigurasi, dan menerapkan agen AI yang dapat memberikan alasan, memutuskan, dan bertindak (dengan aman dan andal) dalam lingkungan perusahaan Anda.
Mengapa menggunakan UiPath Agent Builder dan bukan alat agen LLM generik?
UiPath Agent Builder di Studio dirancang untuk produksi, bukan prototipe. Ini menggabungkan pengembangan berbasis penilaian dan evaluasi untuk kesiapan perusahaan dengan integrasi sempurna ke dalam sistem bisnis Anda yang sudah ada. Anda dapat memanfaatkan rangkaian alat lengkap, termasuk otomatisasi UI dan pemrosesan dokumen cerdas (IDP), melalui antarmuka berkode rendah yang ramah pengguna, dan melakukan penskalaan dengan mudah di seluruh Platform UiPath yang lebih luas untuk otomatisasi menyeluruh.
Bagaimana cara mengevaluasi agen AI sebelum produksi?
Gunakan kumpulan data evaluasi, log penelusuran, dan metrik regresi untuk memvalidasi akurasi, keberhasilan penggunaan alat, dan keamanan. Fitur evaluasi dan penelusuran UiPath menjadikannya sederhana dan dapat diulang.
Bisakah agen berkembang seiring berjalannya waktu?
Ya. Memori agen dan feedback eskalasi membantu agen belajar dari intervensi manusia dan berkembang dengan aman seiring waktu.