Dự án cuối khóa: Một agent thông minh cho doanh nghiệp
Bạn sẽ thiết kế một hệ thống agent hoàn chỉnh lấy tên công ty và tạo ra một bản tóm tắt thông minh cho doanh nghiệp. Nhiệm vụ này bao gồm mọi kỹ năng bạn đã học:
Thiết kế mục tiêu — Mục tiêu rõ ràng với đầu vào và đầu ra được xác định
Sử dụng công cụ — Tìm kiếm web, xử lý dữ liệu, tạo tài liệu
Lập kế hoạch — Chia nhỏ nhiệm vụ với các bước song song và tuần tự
Giới hạn an toàn — Ràng buộc phạm vi, giới hạn chi phí, kiểm tra chất lượng
Đánh giá — Tự đánh giá trước khi đưa ra kết quả
Đầu ra: Một bản tóm tắt có cấu trúc bao gồm tổng quan về công ty, tin tức gần đây, điểm nổi bật về tài chính, vị thế cạnh tranh và những hiểu biết chiến lược.
Bước 1: Xác định mục tiêu
Bắt đầu với một tuyên bố mục tiêu chính xác:
📍 Nơi dán: Mở ChatGPT (chat.openai.com), Claude (claude.ai) hoặc Gemini (gemini.google.com) và bắt đầu một cuộc trò chuyện mới.
📋 Cách sao chép prompt này: Nhấp vào bất kỳ đâu bên trong khối màu xám, nhấn Cmd+A rồi Cmd+C (Mac) hoặc Ctrl+A rồi Ctrl+C (Windows). Hoặc sử dụng biểu tượng sao chép xuất hiện.
MỤC TIÊU: Cho trước tên công ty, hãy lập một bản tóm tắt thông tin kinh doanh bao gồm:
1. Tổng quan về công ty (lĩnh vực hoạt động, quy mô, vị trí thị trường)
2. Những phát triển gần đây (tin tức trong 6 tháng qua)
3. Điểm nổi bật về tài chính (doanh thu, tăng trưởng, các chỉ số chính nếu là công ty niêm yết)
4. Bức tranh cạnh tranh (3 đối thủ hàng đầu, vị trí)
5. Thông tin chiến lược (xu hướng, rủi ro, cơ hội)
ĐẦU VÀO: Tên công ty (chuỗi ký tự)
ĐẦU RA: Báo cáo định dạng Markdown có cấu trúc (2.000-3.000 từ)
TIÊU CHÍ THÀNH CÔNG: Hoàn thành cả 5 phần, trích dẫn nguồn, hoàn thành trong vòng 15 phút
✏️ Cách điền thông tin chi tiết: Thay thế mỗi dấu ngoặc vuông [] và trình giữ chỗ trong ngoặc bằng thông tin cụ thể từ tình huống thực tế của bạn. Thông tin đầu vào không rõ ràng sẽ tạo ra kết quả không rõ ràng — hãy cụ thể.
👀 Những gì bạn sẽ thấy: Trong vòng vài giây, AI sẽ trả về phản hồi có cấu trúc dựa trên yêu cầu ở trên. Hãy đọc kỹ và coi đó là bản nháp, không phải câu trả lời cuối cùng.
📌 Cách xử lý kết quả: Lưu phản hồi vào file Notes. Chọn đề xuất có hiệu quả cao nhất và thực hiện ngay trong tuần này — đừng cố gắng làm tất cả cùng một lúc.
⚠️ Nếu kết quả không ổn: Nếu các đề xuất có vẻ chung chung, hãy dán nội dung sau: "Hãy cụ thể hơn với ngữ cảnh thực tế của tôi. Bỏ những lời khuyên chung chung." Nếu nó bỏ qua các chi tiết quan trọng bạn đã cung cấp, hãy hỏi: "Bạn đã bỏ sót [X] trong ngữ cảnh của tôi — hãy thực hiện lại với điều đó làm ràng buộc chính."
Hãy lưu ý mục tiêu này cụ thể, có thể đo lường và có giới hạn. Agent biết chính xác "hoàn thành" trông như thế nào.
✅ Kiểm tra nhanh: Tại sao mục tiêu lại bao gồm "giao hàng trong vòng 15 phút" như một tiêu chí thành công?
Giới hạn thời gian ngăn cản agent nghiên cứu quá mức. Nếu không có giới hạn thời gian, agent có thể dành hàng giờ để tìm kiếm dữ liệu chỉ tốt hơn một chút. Giới hạn này buộc phải làm việc hiệu quả: Thu thập thông tin quan trọng nhất trong phạm vi ngân sách, sau đó tổng hợp. Nó cũng giúp tránh các vòng lặp vô hạn.
Bước 2: Thiết kế prompt hệ thống
Kết hợp các mẫu từ Bài học 3-6 thành một prompt hệ thống hoàn chỉnh:
Bạn là một Business Intelligence Agent. Nhiệm vụ của bạn là nghiên cứu một công ty và lập một bản tóm tắt tình báo toàn diện.
KHẢ NĂNG:
- Tìm kiếm thông tin hiện tại của công ty trên web
- Đọc tài liệu về báo cáo tài chính và thông cáo báo chí
- Phân tích dữ liệu về các chỉ số tài chính
QUY TRÌNH LẬP KẾ HOẠCH:
1. Chia nghiên cứu thành 5 phần phù hợp với định dạng đầu ra
2. Nghiên cứu từng phần, bắt đầu với tổng quan về công ty
3. Sau mỗi phần, đánh giá: Thông tin có đầy đủ không? Có cập nhật không? Có nguồn đáng tin cậy không?
4. Nếu một phần nào đó yếu, hãy thực hiện thêm một tìm kiếm mục tiêu nữa
TIÊU CHÍ CHẤT LƯỢNG:
- Mỗi tuyên bố thực tế phải có nguồn
- Dữ liệu tài chính phải từ 12 tháng gần nhất
- Ít nhất 3 nguồn khác nhau cho mỗi phần
- Đánh dấu bất kỳ thông tin nào bạn không chắc chắn
GIỚI HẠN PHẠM VI:
- Tối đa 20 lượt tìm kiếm web
- Tối đa 15 phút cho mỗi bản tóm tắt
- Chỉ truy cập thông tin công khai
- Không suy đoán về các thông tin tài chính không công khai
CÁC CHECKPOINT CỦA CON NGƯỜI:
- Tạm dừng nếu công ty có vẻ là công ty tư nhân với rất ít thông tin công khai
- Tạm dừng nếu bạn tìm thấy những mâu thuẫn đáng kể giữa các nguồn
- Tạm dừng nếu nhiệm vụ yêu cầu truy cập vào các cơ sở dữ liệu trả phí
XỬ LÝ THẤT BẠI:
- Nếu tìm kiếm trên web không trả về kết quả nào cho một phần, hãy ghi chú "Thông tin công khai có sẵn rất hạn chế" và tiếp tục
- Nếu dữ liệu tài chính không có sẵn, hãy nêu rõ khoảng trống thay vì đoán mò
- Nếu bạn đã sử dụng hết ngân sách tìm kiếm, hãy cung cấp những gì bạn có kèm theo ghi chú về những thiếu sót
Prompt này tích hợp 5 bài học về các mẫu: Nhận diện và khả năng (Bài học 3), hướng dẫn sử dụng công cụ (Bài học 4), quy trình lập kế hoạch (Bài học 5), các biện pháp bảo vệ (Bài học 6) và đầu ra có cấu trúc.
Bước 3: Xác định bộ công cụ
Áp dụng nguyên tắc công cụ tối thiểu khả thi:
Công cụ
Mục đích
Hạn chế
web_search
Tìm thông tin công ty, tin tức, tài chính
Tối đa 20 truy vấn
read_document
Trích xuất dữ liệu từ các bài viết đã tìm thấy
Chỉ các URL công khai
write_report
Hoàn thiện bản tóm tắt cuối cùng
Định dạng Markdown
Ba công cụ. Agent không cần email, quyền truy cập cơ sở dữ liệu hay khả năng thực thi code cho nhiệm vụ này. Ít công cụ hơn đồng nghĩa với ít lựa chọn sai hơn.
Bước 4: Lập sơ đồ quy trình làm việc
Thiết kế kế hoạch thực hiện của agent:
GIAI ĐOẠN 1 — NGHIÊN CỨU (song song nếu có thể)
├── Tìm kiếm: Tổng quan về công ty + Wikipedia/Crunchbase
├── Tìm kiếm: Tin tức gần đây (6 tháng qua)
├── Tìm kiếm: Dữ liệu tài chính (nếu là công ty niêm yết)
├── Tìm kiếm: Các đối thủ cạnh tranh hàng đầu
└── Đọc: Các bài báo liên quan nhất (toàn văn)
GIAI ĐOẠN 2 — PHÂN TÍCH (tuần tự)
├── Tổng hợp các phát hiện theo từng phần
├── Xác định các mẫu chung giữa các phần
├── Chỉ ra những thiếu sót và điểm chưa chắc chắn
└── Tạo ra những hiểu biết chiến lược
GIAI ĐOẠN 3 — GIAO HÀNG
├── Biên soạn báo cáo theo định dạng có cấu trúc
├── Thêm nguồn trích dẫn
├── Tự đánh giá dựa trên các tiêu chí chất lượng
└── Gửi hoặc báo cáo các vấn đề để người khác xem xét
Giai đoạn 1 sử dụng nghiên cứu song song (các phần không phụ thuộc vào nhau). Giai đoạn 2 phải được thực hiện tuần tự vì phân tích yêu cầu tất cả dữ liệu. Giai đoạn 3 phụ thuộc vào Giai đoạn 2.
Bước 5: Thêm logic đánh giá
Người thực hiện cần tự đánh giá kết quả của mình trước khi nộp:
DANH SÁCH KIỂM TRA TỰ ĐÁNH GIÁ (chạy trước khi nộp):
□ Tất cả 5 phần đều hiện diện và có nội dung (không chỉ là chỗ trống)
□ Ít nhất 8 nguồn độc lập được trích dẫn trong toàn bộ bản tóm tắt
□ Dữ liệu tài chính có ngày tháng (bao gồm cả khoảng thời gian được đề cập)
□ Phần đối thủ cạnh tranh nêu tên các công ty cụ thể, không phải các danh mục chung chung
□ Thông tin chiến lược liên kết với bằng chứng từ các phần trước đó
□ Không có mâu thuẫn chưa được giải quyết giữa các nguồn
□ Tổng độ dài từ 2.000-3.000 từ
Nếu bất kỳ kiểm tra nào không đạt → xác định thiếu sót → thực hiện một tìm kiếm mục tiêu → đánh giá lại
Nếu vẫn không đạt sau khi khắc phục → nộp kèm theo ghi chú rõ ràng về thiếu sót
Đây là thành phần đánh giá từ Bài học 2 đang được áp dụng. Agent không chỉ tạo ra kết quả đầu ra — mà còn xác minh kết quả đầu ra đáp ứng tiêu chuẩn trước khi coi nhiệm vụ là hoàn thành.
Bước 6: Kiểm thử từng bước
Đừng đưa thẳng vào sản xuất. Hãy kiểm thử theo từng giai đoạn:
Test 1 — Kiểm thử sơ bộ: Chạy agent trên một công ty nổi tiếng (Apple, Google). Xác minh: Liệu nó có tìm thấy thông tin chính xác, cập nhật không? Liệu nó có cấu trúc đầu ra chính xác không? Liệu nó có tuân thủ giới hạn 20 kết quả tìm kiếm không?
Test 2 — Trường hợp ngoại lệ: Chạy trên một công ty nhỏ hơn, ít nổi tiếng hơn. Liệu nó có xử lý thông tin hạn chế một cách khéo léo không? Liệu nó có nhận ra những thiếu sót thay vì tạo ra dữ liệu giả không?
Test 3 — Chế độ lỗi: Cố ý cung cấp cho nó một tên công ty hư cấu. Liệu agent có nhận ra rằng không có dữ liệu thực không? Liệu nó có báo cáo vấn đề thay vì tạo ra một báo cáo nghe có vẻ hợp lý nhưng sai sự thật không?
Test 4 — Kiểm thử giới hạn: Giám sát số lượng tìm kiếm. Liệu nó có tuân thủ giới hạn 20 kết quả tìm kiếm không? Liệu nó có tuân thủ giới hạn thời gian không? Liệu nó có tạm dừng tại các checkpoint của người dùng khi thích hợp không?
Mỗi bài kiểm thử xác thực một lớp khác nhau của hệ thống.
✅ Kiểm tra nhanh: Bạn đã bỏ qua bài kiểm tra 3 (công ty hư cấu) vì "rõ ràng là agent sẽ không bao giờ bịa đặt ra một công ty." Một tuần sau khi bắt đầu sản xuất, bản tóm tắt về một công ty con có thật nhưng được đổi tên lại đầy rẫy những chi tiết nghe có vẻ hợp lý nhưng được bịa đặt. Bài kiểm tra nào sẽ phát hiện ra điều này sớm nhất, và mô hình thất bại này cho ta biết điều gì về ảo giác?
Bài kiểm tra 3 — sử dụng một tên hư cấu để thăm dò chính xác chế độ thất bại: Agent tạo ra văn bản nghe có vẻ hợp lý khi không có nguồn thông tin thực tế. Ảo giác không thất bại một cách rõ ràng — nó tạo ra kết quả nghe có vẻ tự tin. Bài test mà bạn đã bỏ qua là bài kiểm tra duy nhất thăm dò bề mặt thất bại cụ thể đó.
Tổng hợp tất cả: Bản kế hoạch hoàn chỉnh
Đây là bản mô tả chi tiết về agent của bạn — một template bạn có thể điều chỉnh cho bất kỳ agent sản xuất nào:
THÔNG SỐ KỸ THUẬT AGENT: Business Intelligence Agent
PHIÊN BẢN: 1.0
1. MỤC TIÊU
Đầu vào: Tên công ty
Đầu ra: Bản tóm tắt tình báo có cấu trúc (5 phần, 2-3 nghìn từ)
Thành công: Tất cả các phần được hoàn thành, có nguồn, được gửi trong vòng <15 phút
2. YÊU CẦU HỆ THỐNG
[Bao gồm toàn bộ yêu cầu hệ thống từ Bước 2]
3. CÔNG CỤ
web_search (tối đa 20 cuộc gọi), read_document, write_report
4. QUY TRÌNH LÀM VIỆC
Giai đoạn 1: Nghiên cứu song song (5 tìm kiếm)
Giai đoạn 2: Phân tích tuần tự
Giai đoạn 3: Tập hợp + đánh giá + gửi
5. GIỚI HẠN
- Phạm vi: chỉ thông tin công khai, không sử dụng cơ sở dữ liệu trả phí
- Giới hạn: 20 tìm kiếm, 15 phút, tối đa 3 nghìn từ
- Checkpoint: thông tin hạn chế, mâu thuẫn, cần quyền truy cập trả phí
- Thất bại: thừa nhận những thiếu sót, không bao giờ Xây dựng
6. ĐÁNH GIÁ
Danh sách kiểm tra trước khi giao hàng với 7 tiêu chí chất lượng
Một lần khắc phục cho mỗi lần kiểm tra không đạt
7. GIÁM SÁT
Ghi nhật ký: mọi truy vấn tìm kiếm và chất lượng kết quả
Theo dõi: các tìm kiếm đã sử dụng, thời gian đã trôi qua, các phần đã hoàn thành
Cảnh báo: nếu ngân sách tìm kiếm đạt 80%, nếu bất kỳ phần nào có 0 nguồn
Bản đặc tả một trang này là tất cả những gì cần thiết để xây dựng, kiểm thử và bảo trì agent. Cho dù bạn triển khai nó trên Claude, ChatGPT, LangGraph hay CrewAI, thiết kế này đều độc lập với nền tảng.
Bài tập: Xây dựng agent của bạn
Chọn cách tiếp cận của bạn:
Không chuyên môn: Mở Claude hoặc ChatGPT. Dán prompt hệ thống từ Bước 2 làm tin nhắn đầu tiên của bạn (hoặc thêm nó dưới dạng Hướng dẫn Tùy chỉnh/Hướng dẫn Dự án). Sau đó, yêu cầu nó nghiên cứu một công ty. Đánh giá kết quả đầu ra dựa trên danh sách kiểm tra trong Bước 5.
Có chuyên môn: Sử dụng một framework như LangGraph hoặc CrewAI. Triển khai agent với các chức năng công cụ thực tế (API tìm kiếm web, trình ghi file). Thêm các biện pháp bảo vệ dưới dạng ràng buộc code (bộ đếm tìm kiếm, giới hạn thời gian). Ghi nhật ký mọi lệnh gọi công cụ để gỡ lỗi.
Dù bằng cách nào, hãy kiểm tra cả 4 kịch bản: Công ty nổi tiếng, công ty ít được biết đến, công ty hư cấu và kiểm tra khả năng chịu tải của các biện pháp bảo vệ.
Những điểm chính cần ghi nhớ
Một agent sản xuất cần 7 thành phần: Mục tiêu, prompt hệ thống, công cụ, quy trình làm việc, các biện pháp bảo vệ, đánh giá và giám sát
Bắt đầu với một mục tiêu chính xác, có thể đo lường được — mọi thứ khác đều bắt nguồn từ đó
Thiết kế prompt hệ thống bằng cách kết hợp các mẫu từ lập kế hoạch, sử dụng công cụ, những biện pháp bảo vệ và đánh giá
Kiểm thử từng bước: Kiểm thử sơ bộ → các trường hợp ngoại lệ → những chế độ lỗi → kiểm thử độ bền của các biện pháp bảo vệ
Bắt đầu với một agent duy nhất; chỉ thêm độ phức tạp (nhiều agent) khi có bằng chứng cho thấy nó cải thiện kết quả
Mẫu đặc tả agent hoạt động trên nhiều nền tảng — thiết kế không phụ thuộc vào nền tảng
Giờ đây bạn đã có bộ công cụ hoàn chỉnh để xây dựng các agent đủ tin cậy cho công việc thực tế
Câu 1:
Nguyên tắc quan trọng nhất khi quyết định giữa hệ thống một agent và hệ thống multi-agent là gì?
GIẢI THÍCH:
Sự phức tạp có chi phí: Nhiều agent hơn có nghĩa là chi phí giao tiếp cao hơn, nhiều điểm lỗi hơn và việc gỡ lỗi khó khăn hơn. Hãy bắt đầu với một agent được thiết kế tốt. Nếu bạn thấy rằng chất lượng nghiên cứu bị ảnh hưởng vì cùng một agent vừa phải viết vừa phải xem xét, thì hãy chia thành các agent chuyên biệt. Hãy để bằng chứng định hướng các quyết định về kiến trúc.
Câu 2:
Khi thử nghiệm agent trước khi triển khai sản xuất, phương pháp nào hiệu quả nhất?
GIẢI THÍCH:
Kiểm tra từng bước giúp phát hiện sớm các vấn đề. Bắt đầu với một nhiệm vụ đơn giản để xác minh vòng lặp suy luận hoạt động, sau đó tăng độ phức tạp để kiểm tra việc lập kế hoạch và chuỗi công cụ. Cố ý tạo ra các trường hợp ngoại lệ — điều gì xảy ra khi tìm kiếm không trả về kết quả nào? Khi API bị lỗi? Khi agent nhận được dữ liệu mâu thuẫn? Mỗi lần thử nghiệm sẽ củng cố hệ thống.
Câu 3:
Điều gì bạn nên xác định ĐẦU TIÊN khi xây dựng hệ thống agent sản xuất?
GIẢI THÍCH:
Mọi thứ đều bắt nguồn từ mục tiêu. Một mục tiêu rõ ràng ('tạo báo cáo phân tích đối thủ cạnh tranh với giá cả, tính năng và định vị cho 5 công ty') xác định những công cụ mà agent cần, những giới hạn cần thêm vào, cách đánh giá thành công và khi nào agent hoàn thành. Các mục tiêu mơ hồ ('nghiên cứu đối thủ cạnh tranh') tạo ra những agent mơ hồ.
Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây: