ในการพัฒนา AI Agent ในปัจจุบัน นักพัฒนามักเจอปัญหาที่ต้องเลือกระหว่าง "ความเก่ง" กับ "ความคุ้มค่า" หากใช้โมเดลที่ฉลาดที่สุดอย่าง Claude 3 Opus ทุกขั้นตอน ต้นทุนก็จะสูงมาก แต่ถ้าใช้โมเดลที่เล็กลงอย่าง Sonnet หรือ Haiku งานที่ซับซ้อนก็อาจจะผิดพลาดได้
Anthropic จึงได้นำเสนอกลยุทธ์ใหม่ที่เรียกว่า "The Advisor Strategy" เพื่อทลายข้อจำกัดนี้
1. แนวคิดหลัก: การแบ่งแยกหน้าที่ (The Executor vs. The Advisor)
แทนที่จะใช้โมเดลเดียวทำทุกอย่าง กลยุทธ์นี้เสนอให้แบ่งโมเดลออกเป็น 2 บทบาท:
- The Executor (ผู้ปฏิบัติงาน): ใช้โมเดลที่เร็วและราคาถูก (เช่น Claude 3.5 Sonnet หรือ Haiku) เป็นตัวหลักในการรันงาน ทำงานซ้ำๆ เรียกใช้เครื่องมือ (Tool Use) และจัดฟอร์แมตข้อมูล
- The Advisor (ที่ปรึกษา): ใช้โมเดลที่ฉลาดที่สุด (เช่น Claude 3 Opus) คอยสแตนด์บายเพื่อรับคำปรึกษาเฉพาะใน "จุดที่ยากจริงๆ" หรือจุดที่ต้องใช้การตัดสินใจระดับสูงเท่านั้น
2. กลไกการทำงาน
ภายใต้กลยุทธ์นี้ ระบบจะทำงานผ่านเครื่องมือที่เรียกว่า Advisor Tool:
- Executor จะเริ่มทำงานตามคำสั่งปกติ
- เมื่อเจอสถานการณ์ที่กำกวม ซับซ้อน หรือเสี่ยงต่อความผิดพลาด Executor จะส่งสัญญาณขอคำปรึกษาไปยัง Advisor
- Advisor จะรับบริบททั้งหมดไปวิเคราะห์ แล้วส่ง "คำแนะนำเชิงกลยุทธ์" หรือ "แผนการทำงาน" กลับมาให้
- Executor นำคำแนะนำนั้นไปปฏิบัติงานต่อจนจบ
3. ทำไมกลยุทธ์นี้ถึงคุ้มค่า?
จากข้อมูลของ Anthropic พบว่าการใช้กลยุทธ์นี้ให้ผลลัพธ์ที่น่าทึ่ง:
- ประสิทธิภาพสูงขึ้น: ในการทดสอบอย่าง SWE-bench (การแก้โจทย์เขียนโปรแกรมซับซ้อน) การใช้ Sonnet ร่วมกับ Advisor ให้ผลลัพธ์ที่แม่นยำกว่าการใช้โมเดลเดี่ยวๆ
- ลดต้นทุนได้จริง: สามารถลดต้นทุนลงได้เฉลี่ยประมาณ 12% เมื่อเทียบกับการใช้โมเดลใหญ่เพียงตัวเดียว เพราะงานส่วนใหญ่ (Bulk of tokens) ถูกประมวลผลโดยโมเดลราคาถูก
- ความเร็ว: ระบบทำงานได้รวดเร็วขึ้น เพราะไม่ต้องใช้โมเดลใหญ่ประมวลผลในขั้นตอนง่ายๆ ที่ไม่จำเป็น
4. กรณีการใช้งานที่เหมาะสม (Use Cases)
- Coding & Software Engineering: ให้โมเดลเล็กเขียนโค้ดส่วนย่อย และให้โมเดลใหญ่ช่วยวางโครงสร้างระบบ (Architecture) หรือตรวจสอบจุดที่อาจเกิดบั๊ก
- Customer Support: ให้โมเดลเล็กตอบคำถามทั่วไป และเรียกโมเดลใหญ่เมื่อเจอเคสที่ซับซ้อนหรือต้องใช้การตัดสินใจเรื่องนโยบาย
- Content Generation: ให้โมเดลเล็กร่างเนื้อหาจำนวนมาก และให้โมเดลใหญ่คอยเกลาสำนวนและตรวจสอบความถูกต้องเชิงลึก
บทสรุป
The Advisor Strategy คือการเปลี่ยนวิธีคิดจากการใช้ AI แบบ "One-size-fits-all" มาเป็นการทำงานแบบ "ทีม" ที่มีทั้งคนลงมือทำและที่ปรึกษาผู้เชี่ยวชาญ ซึ่งถือเป็นทิศทางสำคัญในการสร้าง AI Agent ที่ทรงพลังและสามารถใช้งานได้จริงในสเกลธุรกิจ โดยไม่ทำให้งบบานปลาย