คัมภีร์ลับ สรุปกลยุทธ์ใช้ AI แบบมือโปร ‘The Advisor Strategy’ จาก Anthropic (ผู้สร้าง Claude)

ในการพัฒนา AI Agent ในปัจจุบัน นักพัฒนามักเจอปัญหาที่ต้องเลือกระหว่าง "ความเก่ง" กับ "ความคุ้มค่า" หากใช้โมเดลที่ฉลาดที่สุดอย่าง Claude 3 Opus ทุกขั้นตอน ต้นทุนก็จะสูงมาก แต่ถ้าใช้โมเดลที่เล็กลงอย่าง Sonnet หรือ Haiku งานที่ซับซ้อนก็อาจจะผิดพลาดได้

Anthropic จึงได้นำเสนอกลยุทธ์ใหม่ที่เรียกว่า "The Advisor Strategy" เพื่อทลายข้อจำกัดนี้

1. แนวคิดหลัก: การแบ่งแยกหน้าที่ (The Executor vs. The Advisor)

แทนที่จะใช้โมเดลเดียวทำทุกอย่าง กลยุทธ์นี้เสนอให้แบ่งโมเดลออกเป็น 2 บทบาท:

The Executor (ผู้ปฏิบัติงาน): ใช้โมเดลที่เร็วและราคาถูก (เช่น Claude 3.5 Sonnet หรือ Haiku) เป็นตัวหลักในการรันงาน ทำงานซ้ำๆ เรียกใช้เครื่องมือ (Tool Use) และจัดฟอร์แมตข้อมูล
The Advisor (ที่ปรึกษา): ใช้โมเดลที่ฉลาดที่สุด (เช่น Claude 3 Opus) คอยสแตนด์บายเพื่อรับคำปรึกษาเฉพาะใน "จุดที่ยากจริงๆ" หรือจุดที่ต้องใช้การตัดสินใจระดับสูงเท่านั้น

2. กลไกการทำงาน

ภายใต้กลยุทธ์นี้ ระบบจะทำงานผ่านเครื่องมือที่เรียกว่า Advisor Tool:

Executor จะเริ่มทำงานตามคำสั่งปกติ
เมื่อเจอสถานการณ์ที่กำกวม ซับซ้อน หรือเสี่ยงต่อความผิดพลาด Executor จะส่งสัญญาณขอคำปรึกษาไปยัง Advisor
Advisor จะรับบริบททั้งหมดไปวิเคราะห์ แล้วส่ง "คำแนะนำเชิงกลยุทธ์" หรือ "แผนการทำงาน" กลับมาให้
Executor นำคำแนะนำนั้นไปปฏิบัติงานต่อจนจบ

3. ทำไมกลยุทธ์นี้ถึงคุ้มค่า?

จากข้อมูลของ Anthropic พบว่าการใช้กลยุทธ์นี้ให้ผลลัพธ์ที่น่าทึ่ง:

ประสิทธิภาพสูงขึ้น: ในการทดสอบอย่าง SWE-bench (การแก้โจทย์เขียนโปรแกรมซับซ้อน) การใช้ Sonnet ร่วมกับ Advisor ให้ผลลัพธ์ที่แม่นยำกว่าการใช้โมเดลเดี่ยวๆ
ลดต้นทุนได้จริง: สามารถลดต้นทุนลงได้เฉลี่ยประมาณ 12% เมื่อเทียบกับการใช้โมเดลใหญ่เพียงตัวเดียว เพราะงานส่วนใหญ่ (Bulk of tokens) ถูกประมวลผลโดยโมเดลราคาถูก
ความเร็ว: ระบบทำงานได้รวดเร็วขึ้น เพราะไม่ต้องใช้โมเดลใหญ่ประมวลผลในขั้นตอนง่ายๆ ที่ไม่จำเป็น

4. กรณีการใช้งานที่เหมาะสม (Use Cases)

Coding & Software Engineering: ให้โมเดลเล็กเขียนโค้ดส่วนย่อย และให้โมเดลใหญ่ช่วยวางโครงสร้างระบบ (Architecture) หรือตรวจสอบจุดที่อาจเกิดบั๊ก
Customer Support: ให้โมเดลเล็กตอบคำถามทั่วไป และเรียกโมเดลใหญ่เมื่อเจอเคสที่ซับซ้อนหรือต้องใช้การตัดสินใจเรื่องนโยบาย
Content Generation: ให้โมเดลเล็กร่างเนื้อหาจำนวนมาก และให้โมเดลใหญ่คอยเกลาสำนวนและตรวจสอบความถูกต้องเชิงลึก

บทสรุป

The Advisor Strategy คือการเปลี่ยนวิธีคิดจากการใช้ AI แบบ "One-size-fits-all" มาเป็นการทำงานแบบ "ทีม" ที่มีทั้งคนลงมือทำและที่ปรึกษาผู้เชี่ยวชาญ ซึ่งถือเป็นทิศทางสำคัญในการสร้าง AI Agent ที่ทรงพลังและสามารถใช้งานได้จริงในสเกลธุรกิจ โดยไม่ทำให้งบบานปลาย