Kỹ thuật viết prompt cho AI Voice Agent

Viết prompt cho voice agent hoàn toàn khác với viết prompt cho chatbot. Và nếu bạn xử lý chúng theo cùng một cách, agent của bạn sẽ nghe giống như một con robot đang đọc bài viết trên Wikipedia vào điện thoại.

🔄 Tóm tắt nhanh: Trong bài học 4, bạn đã học rằng các cuộc hội thoại bằng giọng nói có những ràng buộc nghiêm ngặt - tối đa 3 câu mỗi lượt, thiết kế lời chào tự nhiên, xử lý gián đoạn và các lộ trình chuyển giao. Bây giờ, chúng ta sẽ đi sâu hơn: Làm thế nào để bạn thực sự viết prompt hệ thống giúp tất cả những điều đó hoạt động?

Viết nội dung cho tai, không phải cho màn hình

Điều quan trọng về giọng nói là: Người gọi không thể cuộn lại. Họ không thể đọc lại đoạn văn cuối cùng của bạn. Họ chỉ nghe một lần, và nếu không hiệu quả, nó sẽ biến mất.

Điều đó thay đổi mọi thứ về cách bạn đưa ra prompt.

Prompt văn bản từ chatbot: "Tôi rất vui được giúp bạn đặt lịch hẹn. Dựa trên lịch hiện tại, chúng tôi có các khung giờ trống vào Thứ Ba, ngày 14 tháng 3 lúc 2:00 chiều, 3:30 chiều và 4:45 chiều, cũng như Thứ Tư, ngày 15 tháng 3 lúc 9:00 sáng, 10:15 sáng và 1:00 chiều. Lựa chọn nào phù hợp nhất với lịch trình của bạn?"

Tổng là 58 từ. Đến khi người gọi nghe thấy "1:00 chiều", họ đã quên mất Thứ Ba tồn tại.

Prompt được tối ưu hóa cho giọng nói: "Tôi có các khung giờ trống vào Thứ Ba và Thứ Tư. Bạn có muốn bắt đầu với các khung giờ của Thứ Ba không?"

14 từ. Người gọi biết chính xác phải nói gì tiếp theo.

Nguyên tắc: Giữ câu trả lời dưới 35 từ. Đó là khoảng 3 câu khi nói to. Bất cứ điều gì dài hơn sẽ làm giảm khả năng hiểu nhanh chóng.

Kiểm tra nhanh: Voice agent của bạn cần cho người gọi biết về ba tùy chọn gói dịch vụ (Basic, Pro, Enterprise). Có vấn đề gì khi liệt kê cả ba cùng một lúc?

Câu trả lời: Người gọi không thể nhớ cả ba. Thay vào đó, hãy bắt đầu bằng một câu hỏi - "Bạn đang tìm kiếm gói dịch vụ cho cá nhân hay cho nhóm?" - sau đó thu hẹp lại thành tùy chọn phù hợp. Hướng dẫn, chứ đừng đưa ra quá nhiều thông tin.

Cấu trúc prompt hệ thống cho voice agent

Mỗi prompt hệ thống cho voice agent cần có 5 phần. Bỏ qua một phần và mọi thứ sẽ trở nên rối loạn.

1. Vai trò

Agent là ai? Không chỉ đơn giản là "bạn là một trợ lý hữu ích." Hãy cụ thể.

Bạn là Maya, trợ lý lên lịch tại Bright Smile Dental.
Bạn giúp bệnh nhân đặt lịch, thay đổi lịch và hủy lịch hẹn.
Bạn nói chuyện với giọng điệu ấm áp, thân thiện — giống như một lễ tân
đã làm việc ở đây nhiều năm và biết những khách quen.

Vai trò xác định tính cách, phạm vi và giới hạn cùng một lúc. "Maya tại Bright Smile Dental" sẽ không cố gắng trả lời các câu hỏi về bảo hiểm ô tô.

2. Mục tiêu

Mỗi cuộc gọi cần đạt được điều gì? Liệt kê chúng theo thứ tự ưu tiên.

Mục tiêu của bạn (theo thứ tự ưu tiên):
1. Xác định người gọi và lý do họ gọi
2. Giải quyết yêu cầu của họ (đặt lịch, thay đổi lịch hoặc hủy)
3. Xác nhận tất cả các chi tiết trước khi kết thúc cuộc gọi
4. Giữ cuộc gọi dưới 3 phút

3. Hướng dẫn từng bước

Đây là nơi hầu hết mọi người mắc lỗi. Họ viết những hướng dẫn chung chung như "giúp người gọi đặt lịch hẹn". Voice agent cần các bước cụ thể.

Hãy làm theo quy trình này:
1. Chào người gọi: "Chào, tôi là Maya từ Bright Smile Dental. Tôi có thể giúp gì cho bạn hôm nay?"
2. Xác định mục đích: đặt lịch, thay đổi lịch hoặc hủy bỏ
3. Đối với việc đặt lịch: hỏi ngày ưu tiên, sau đó đề xuất 2-3 khung giờ
4. Đối với việc thay đổi lịch: hỏi tên, tìm lịch hẹn hiện có, đề xuất các lựa chọn thay thế
5. Đối với việc hủy bỏ: hỏi tên, xác nhận lịch hẹn, xử lý việc hủy bỏ
6. Xác nhận: nhắc lại tất cả các chi tiết cho người gọi
7. Kết thúc: "Xong rồi! Tôi có thể giúp gì thêm không?"

Lưu ý cách mỗi bước hướng dẫn agent chính xác những gì cần nói hoặc làm. Không có sự mơ hồ.

4. INSTRUCTIONS và COMMANDS

Sự khác biệt này quan trọng hơn trong giọng nói so với bất kỳ nơi nào khác.

INSTRUCTIONS (HƯỚNG DẪN) là các nguyên tắc ứng xử. Chúng định hình giọng điệu và phong cách:

Hướng dẫn:
- Hãy trò chuyện và thân thiện
- Sử dụng tên của người gọi sau khi họ cung cấp
- Nếu người gọi có vẻ bực bội, hãy thừa nhận điều đó trước khi giải quyết vấn đề
- Nói bằng những câu ngắn gọn

COMMANDS (MỆNH LỆNH) là những quy tắc không thể thương lượng. Viết IN HOA TOÀN BỘ để hệ thống LLM coi chúng là ưu tiên cao:

Mệnh lệnh:
- LUÔN xác nhận ngày, giờ và người cung cấp dịch vụ trước khi đặt lịch
- KHÔNG BAO GIỜ đưa ra lời khuyên y tế dưới bất kỳ hình thức nào
- KHÔNG BAO GIỜ bịa đặt về thời gian rảnh — nếu bạn không có dữ liệu lịch trình, hãy nói rõ điều đó
- LUÔN đề nghị chuyển máy cho người thật nếu người gọi hỏi hai lần về điều bạn không thể làm
- KHÔNG viết đầy đủ các con số — hãy nói "hai giờ ba mươi" chứ không phải "2:3:0"

Các lệnh là những rào cản bảo vệ bạn. Chúng ngăn chặn agent đi chệch kịch bản theo những cách nguy hiểm hoặc gây khó xử.

Kiểm tra nhanh: "Hãy thân thiện" là một INSTRUCTION hay một COMMAND?

Câu trả lời: INSTRUCTION. Đó là một hướng dẫn về hành vi, không phải là một quy tắc nghiêm ngặt. "TUYỆT ĐỐI KHÔNG chia sẻ thông tin sức khỏe bệnh nhân" - đó là một COMMAND. Sự khác biệt: liệu việc vi phạm nó có gây ra tác hại thực sự không? Nếu có, đó là một COMMAND.

5. Các giới hạn an toàn

Các giới hạn an toàn xử lý những trường hợp ngoại lệ. Điều gì xảy ra khi cuộc trò chuyện đi chệch hướng?

Giới hạn an toàn:
- Nếu người gọi hỏi về giá cả, hãy nói: "Tôi có thể giúp bạn lên lịch.
  Đối với các câu hỏi về giá cả, tôi sẽ kết nối bạn với nhóm thanh toán của chúng tôi."
- Nếu bạn không hiểu sau 2 lần thử, hãy nói: "Tôi muốn chắc chắn
  Tôi hiểu rồi. Để tôi chuyển máy cho người có thể giúp đỡ."
- Nếu người gọi dùng từ ngữ tục tĩu, hãy trả lời bình tĩnh: "Tôi hiểu bạn đang
  bực bội. Để tôi kết nối bạn với một thành viên trong nhóm có thể giúp đỡ."
- Nếu im lặng hơn 5 giây, hãy nói: "Bạn vẫn còn ở đó chứ?"

Xử lý sự mơ hồ và lời nói không rõ ràng

Giọng nói có vấn đề mà văn bản không có: Mọi người nói lẩm bẩm, nói lửng lơ, thay đổi ý giữa chừng và nói chen vào lời người hỗ trợ. Prompt của bạn cần xử lý tất cả những điều đó.

Ba quy tắc cho sự mơ hồ:

  1. Đừng bao giờ đoán. Nếu bạn không chắc người gọi nói gì, hãy hỏi. "Chỉ để chắc chắn rằng tôi nghe đúng - bạn nói thứ Ba hay thứ Năm?"
  2. Đưa ra các lựa chọn, không phải là các ô trống. Thay vì "Bạn muốn đến vào lúc nào?", hãy thử "Tôi có chỗ trống vào thứ Ba và thứ Năm tuần này". "Cái nào hiệu quả hơn?". Việc trả lời các câu hỏi lựa chọn bằng lời nói dễ hơn so với những câu hỏi mở.
  3. Xác nhận trước khi hành động. Luôn nhắc lại thông tin quan trọng. "Vậy là thứ Năm lúc 2 giờ chiều với bác sĩ Chen." Nghe ổn chứ?" Một cuộc hẹn sai còn tệ hơn việc mất thêm 5 giây để xác nhận.

Thêm những điều này vào prompt hệ thống của bạn:

Xử lý thông tin đầu vào không rõ ràng:
- Nếu bạn không chắc người gọi nói gì, hãy yêu cầu họ lặp lại một lần nữa.
- Nếu vẫn không rõ sau một lần lặp lại, hãy đưa ra hai lựa chọn có khả năng xảy ra:
  "Ý bạn là [lựa chọn A] hay [lựa chọn B]?"
- KHÔNG BAO GIỜ giả định hoặc đoán các chi tiết quan trọng (ngày, giờ, tên, số tiền)

Kiểm tra nhanh: Một người gọi nói "Tôi cần đến vào lúc nào đó trong tuần này, có thể là khoảng thứ Năm". Agent nên trả lời như thế nào?

Câu trả lời: Đừng đặt lịch vào thứ Năm. Đưa ra các khung giờ cụ thể: "Tôi có chỗ trống vào thứ Năm lúc 10 giờ sáng và 2 giờ chiều, và thứ Sáu lúc 9 giờ sáng. Có khung giờ nào phù hợp không?" Biến ý định mơ hồ thành các lựa chọn cụ thể.

Ví dụ đầy đủ: Agent đặt lịch hẹn

Đây là prompt hệ thống hoàn chỉnh kết hợp cả 5 phần:

VAI TRÒ: Bạn là Maya, trợ lý lên lịch tại Bright Smile Dental.
Giọng nói của bạn ấm áp, thân thiện và chuyên nghiệp - giống như một nhân viên lễ tân
người thực sự quan tâm đến việc giúp đỡ.

MỤC TIÊU:
1. Xác định người gọi và nhu cầu của họ
2. Đặt lịch, thay đổi lịch hoặc hủy cuộc hẹn
3. Xác nhận tất cả các chi tiết trước khi kết thúc cuộc gọi

HƯỚNG DẪN:
- Giữ mỗi câu trả lời dưới 3 câu
- Sử dụng tên của người gọi sau khi họ nói tên
- Nếu người gọi có vẻ vội vàng, hãy nói chuyện với tốc độ của họ
- Đưa ra tối đa 2-3 lựa chọn thời gian, không bao giờ nhiều hơn

MỆNH LỆNH:
- LUÔN xác nhận ngày, giờ và nhà cung cấp trước khi đặt lịch
- KHÔNG BAO GIỜ đưa ra lời khuyên y tế hoặc nha khoa
- KHÔNG BAO GIỜ tự bịa ra thời gian rảnh - hãy kiểm tra công cụ đặt lịch
- LUÔN đề nghị chuyển máy cho người khác nếu bạn không thể giải quyết trong 2 lần thử
- KHÔNG đọc lại số điện thoại từng chữ số một - hãy nhóm chúng lại một cách tự nhiên

QUY TRÌNH TỪNG BƯỚC:
1. "Chào, tôi là Maya từ Bright Smile Dental. Tôi có thể giúp gì cho bạn hôm nay?
2. Xác định mục đích: đặt lịch, đổi lịch hoặc hủy lịch
3. Đối với đặt lịch mới: hỏi ngày ưu tiên → đề xuất 2-3 khung giờ → xác nhận
4. Đối với đổi lịch: hỏi tên → tìm lịch hẹn → đề xuất các lựa chọn thay thế → xác nhận
5. Đối với hủy lịch: hỏi tên → xác nhận lịch hẹn → xử lý → xác nhận
6. "Xong rồi, [tên]! Tôi còn có thể giúp gì nữa không?"
7. "Tuyệt vời, chúc bạn một ngày tốt lành!"

CÁC GIỚI HẠN AN TOÀN:
- Câu hỏi về giá cả → "Để biết giá cả, tôi sẽ chuyển bạn đến bộ phận thanh toán."
- Câu hỏi về bảo hiểm → "Tôi có thể kiểm tra xem chúng tôi có chấp nhận bảo hiểm của bạn không." Bạn đang sử dụng dịch vụ của nhà cung cấp nào?
- Trường hợp khẩn cấp → "Nếu đây là trường hợp khẩn cấp về răng miệng, tôi sẽ kết nối bạn với bác sĩ trực ngay lập tức."
- Im lặng > 5 giây → "Bạn vẫn còn ở đó chứ?"
- Người gọi bực bội → Trước tiên hãy thừa nhận, sau đó giải quyết: "Tôi rất tiếc về điều đó." Để tôi giúp bạn."

Ví dụ đầy đủ: Agent hỗ trợ khách hàng

Trường hợp sử dụng khác, cấu trúc tương tự:

VAI TRÒ: Bạn là Alex, nhân viên hỗ trợ của CloudSync, một dịch vụ lưu trữ file.
Bạn kiên nhẫn, am hiểu và tập trung vào việc giải quyết vấn đề nhanh chóng.

MỤC TIÊU:
1. Xác định khách hàng và vấn đề của họ
2. Giải quyết vấn đề hoặc chuyển tiếp cho nhóm phù hợp
3. Xác nhận vấn đề đã được giải quyết trước khi kết thúc

HƯỚNG DẪN:
- Giữ câu trả lời trong 1-2 câu nếu có thể
- Hướng dẫn khắc phục sự cố từng bước một - đừng đưa ra 5 bước cùng một lúc
- Nếu một bước yêu cầu người gọi thực hiện điều gì đó, hãy đợi họ hoàn thành

MỆNH LỆNH:
- KHÔNG BAO GIỜ yêu cầu mật khẩu hoặc số thẻ tín dụng đầy đủ
- LUÔN LUÔN xác minh danh tính của người gọi bằng địa chỉ email của họ trước
- KHÔNG BAO GIỜ hứa hoàn tiền - chuyển đến bộ phận thanh toán để yêu cầu hoàn tiền
- KHÔNG khắc phục sự cố quá 3 bước - chuyển tiếp sau đó

QUY TRÌNH TỪNG BƯỚC:
1. "Chào, tôi là Alex từ bộ phận hỗ trợ CloudSync. Tôi có thể giúp gì cho bạn?
2. Xác minh danh tính: "Tôi có thể lấy địa chỉ email của bạn trong tài khoản không?"
3. Xác định loại sự cố: sự cố đồng bộ, thanh toán, quyền truy cập hoặc sự cố khác
4. Đối với sự cố đồng bộ: "Trước tiên, hãy thử một việc - bạn có thể kiểm tra xem ứng dụng CloudSync có đang chạy không?"
5. Thực hiện tối đa 3 bước khắc phục sự cố, từng bước một
6. Nếu không được giải quyết: "Tôi muốn đảm bảo vấn đề này được khắc phục. Tôi sẽ kết nối bạn với nhóm kỹ thuật của chúng tôi."
7. "Tôi còn có thể giúp gì nữa không? Tuyệt vời, cảm ơn bạn đã gọi đến CloudSync!"

Bài tập: Viết prompt hệ thống cho voice agent

Chọn một trong những tình huống sau (hoặc sử dụng tình huống của riêng bạn):

  1. Nhân viên đặt chỗ nhà hàng - nhận đặt chỗ, xử lý các yêu cầu về chế độ ăn uống, quản lý danh sách chờ
  2. Nhân viên hỗ trợ CNTT - reset mật khẩu, khắc phục sự cố VPN, chuyển tiếp các vấn đề về phần cứng
  3. Nhân viên lên lịch xem nhà bất động sản - đặt lịch xem nhà, thu thập sở thích của người mua

Viết một prompt hệ thống với đầy đủ 5 phần: Vai trò, Mục tiêu, Hướng dẫn, Mệnh lệnh và Giới hạn an toàn. Giữ quy trình từng bước trong 5-7 bước. Bao gồm ít nhất 3 MỆNH LỆNH và 3 tình huống giới hạn an toàn.

Kiểm tra bằng cách đọc to các phản hồi của nhân viên. Nếu bất kỳ phản hồi nào mất hơn 10 giây để nói, thì nó quá dài.

Những điểm chính cần ghi nhớ

  • Voice prompt phải tạo ra phản hồi dưới 35 từ - người gọi không thể đọc lại
  • Prompt hệ thống cần có 5 phần: Vai trò, Mục tiêu, Hướng dẫn, Mệnh lệnh và Giới hạn an toàn
  • INSTRUCTIONS định hướng hành vi và giọng điệu; COMMANDS (VIẾT HOA) là những quy tắc không thể thương lượng
  • Xử lý sự mơ hồ bằng cách đặt câu hỏi làm rõ, đưa ra lựa chọn và xác nhận trước khi hành động
  • Luôn bao gồm các biện pháp bảo vệ cho những trường hợp ngoại lệ: Câu hỏi về giá cả, người gọi bực bội, im lặng, trường hợp khẩn cấp
  • Kiểm tra bằng cách đọc to các câu trả lời - nếu nghe có vẻ kỳ lạ khi nói ra, hãy viết lại
  • Câu 1:

    Một người gọi nói 'Tôi nghĩ cuộc hẹn của tôi là thứ Ba tuần tới... hoặc có thể là thứ Tư?' Một voice agent được hướng dẫn tốt nên xử lý tình huống này như thế nào?

    GIẢI THÍCH:

    Sự mơ hồ luôn hiện hữu trong giao tiếp bằng giọng nói. Người gọi thường nói lửng, thay đổi ý định giữa chừng và không chắc chắn về chi tiết. Một voice prompt tốt bao gồm hướng dẫn xử lý sự không chắc chắn: Đừng đoán mò, đừng lảng tránh - hãy đặt câu hỏi cụ thể để làm rõ vấn đề và giúp cuộc trò chuyện tiếp tục.

  • Câu 2:

    Sự khác biệt giữa INSTRUCTIONS (HƯỚNG DẪN) và COMMANDS (MỆNH LỆNH) trong prompt hệ thống voice agent là gì?

     

    GIẢI THÍCH:

    INSTRUCTIONS định hướng giọng điệu và hành vi chung - chúng định hình *cách* agent hành động. COMMANDS (thường được viết IN HOA) là các quy tắc không thể thương lượng - chúng xác định *những gì* agent phải hoặc không bao giờ được làm. Một voice prompt được cấu trúc tốt sử dụng cả hai: INSTRUCTIONS để tạo cá tính, COMMANDS để giới hạn hành vi.

  • Câu 3:

    Độ dài phản hồi tối đa được khuyến nghị cho voice agent là bao nhiêu?

    GIẢI THÍCH:

    Nghiên cứu cho thấy người gọi bắt đầu mất khả năng hiểu sau khoảng 35 từ hoặc 3 câu. Không giống như văn bản, họ không thể đọc lại. Ngắn hơn mức cần thiết (10 từ) khiến agent nghe có vẻ máy móc và không hữu ích. Điểm tối ưu là cung cấp đủ thông tin hữu ích mà không làm người nghe bị quá tải.

Thứ Tư, 29/04/2026 15:10
51 👨
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo