Trí tuệ nhân tạo (AI) đã xuất hiện hơn một thập kỷ nay, nhưng tính hữu ích của AI hiện nay chỉ được khẳng định thông qua việc liệu nó có thể hoạt động trong thế giới thực hay không.
ChatGPT Agent là một nỗ lực giải quyết vấn đề tương tự. Thay vì là một chatbot Generative AI, nó biến ChatGPT thành một công cụ có thể chủ động, kích hoạt hành động và xử lý các nhiệm vụ thay mặt bạn.
Hãy cùng xem xét ChatGPT Agent, xem nó được thiết kế để làm gì và liệu nó có thành công hay không!
ChatGPT Agent là gì?
ChatGPT Agent vừa là mô hình agentic AI từ OpenAI, vừa là tính năng ChatGPT sử dụng mô hình đó. Mô hình agentic là mô hình có khả năng thực hiện các mục tiêu phức tạp, nhiều bước với sự can thiệp tối thiểu của con người: Bạn chỉ cần cho ChatGPT Agent biết mình muốn nó làm gì, và nó sẽ tự động thực hiện.
Điều này bao gồm các việc như lên kế hoạch cho một bữa tiệc tối và thêm các nguyên liệu cần thiết vào giỏ hàng Instacart, tạo báo cáo hoặc bài thuyết trình dựa trên những cuộc gọi khách hàng sắp tới trong lịch của bạn, hoặc tạo bảng tính dựa trên một loạt các báo cáo tài chính.
Để đạt được tất cả những điều này, ChatGPT Agent là sự kết hợp của một vài công cụ khác nhau:
- Nó có một máy tính ảo, có thể sử dụng chuột và bàn phím mô phỏng để duyệt các trang web như thể đó là con người. Nó cũng có thể chạy các lệnh terminal để thực thi code, phân tích dữ liệu, tạo slide và bảng tính. (OpenAI lần đầu tiên trình diễn tính năng này với tên gọi Operator).
- Nó có thể tham gia vào quá trình suy luận và nghiên cứu nhiều bước, đồng thời tổng hợp tất cả thông tin tìm thấy thành các báo cáo hữu ích. (Đây là cốt lõi của nghiên cứu chuyên sâu, và vẫn là một trong những tính năng tốt nhất của ChatGPT).
- Nó có quyền truy cập vào các nguồn dữ liệu và ứng dụng bên ngoài thông qua Connectors; mặc dù hiện tại, bạn chỉ có thể sử dụng một số dịch vụ như Gmail, Google Drive và GitHub. Bạn cũng có thể upload lên các file để nó xử lý.
Và tất cả điều này được kết nối với trí thông minh tổng quát và khả năng đàm thoại của ChatGPT.
OpenAI gọi ChatGPT Agent là "sự tiến hóa tự nhiên của Operator và nghiên cứu chuyên sâu". Điều đó đúng. Nó không phải là một bước nhảy vọt mang tính cách mạng mà là bước tiếp theo hợp lý hướng tới các công cụ AI hữu ích và thiết thực hơn.
ChatGPT Agent chưa hoàn toàn sẵn sàng hoạt động độc lập. Bạn sẽ sử dụng trình duyệt của nó để đăng nhập vào tài khoản hoặc thanh toán cho những thứ nó đã thêm vào giỏ hàng của bạn. Nó cũng sẽ hỏi bạn một số câu hỏi để làm rõ những gì bạn muốn nó làm. Hãy coi nó như một agent cộng tác cần một chút giám sát.
ChatGPT Agent có thể làm gì?

ChatGPT là một trong những công cụ linh hoạt nhất mà OpenAI đã tạo ra - ít nhất là về mặt lý thuyết. Không thể liệt kê chi tiết mọi thứ bạn có thể làm với nó, vì vậy, thay vào đó, đây là một tập hợp các loại việc mà nó có khả năng thực hiện (ít nhất là trong một số trường hợp). Đây là sự kết hợp giữa các đề xuất của OpenAI, những việc bạnn đã cho nó làm, đề xuất từ những người khác và đề xuất từ chính ChatGPT.
Điều quan trọng cần lưu ý là danh sách này có phần lý tưởng. Nếu mọi việc suôn sẻ, đây là loại việc nó có thể làm. Liệu nó có thành công hay không phụ thuộc vào các tài nguyên cụ thể mà nó đang cố gắng sử dụng. Tuy nhiên, ChatGPT có thể hoạt động không ổn định.
Đây là một số ý tưởng:
- Nghiên cứu về bộ dụng cụ khoan lỗ bỏ túi tốt nhất, tìm một cửa hàng bán nó ở Dublin và thêm nó vào giỏ hàng của bạn.
- So sánh giá MacBook Pro M4 giữa các nhà bán lẻ ở Ireland và Anh, sau đó mua từ lựa chọn rẻ nhất. (Bạn sẽ phải nhập thông tin thẻ.)
- Đặt lịch cắt tóc tại tiệm cắt tóc yêu thích của bạn vào sáng thứ Tư tuần tới. (Nếu bạn cung cấp thông tin đăng nhập, hệ thống sẽ tự động đăng nhập cho bạn.)
- Đặt hoa gửi đến địa chỉ của bạn bè vào ngày sinh nhật của họ.
- Tìm kiếm 10 dịch vụ nhà thuyền hàng đầu ở Alleppey, Kerala, và đặt chỗ nghỉ hai đêm bao gồm bữa ăn.
- Gửi email bằng tiếng Ý cho một trường dạy lặn ở Sicily để sắp xếp hai lần lặn bờ biển với thiết bị cho thuê.
- Đặt chỗ nghỉ tại vườn nho ở Tuscany phù hợp với ngân sách và ngày tháng của bạn.
- Đọc hộp thư Gmail, tóm tắt những email quan trọng hôm nay và soạn thảo thư trả lời theo giọng điệu của bạn.
- Kiểm tra Google Calendar của bạn, đề xuất 3 khung giờ cho cuộc họp nhóm và gửi lời mời.
- Lấy dữ liệu từ nhiều Google Sheets, hợp nhất thành một báo cáo và gửi email cho đồng nghiệp của bạn.
- So sánh hai kịch bản thế chấp bằng cách sử dụng máy tính trực tuyến của ngân hàng và tạo báo cáo PDF.
- Đặt mua bột protein yêu thích của bạn khi sắp hết.
- Tạo hình ảnh AI về chú chó của bạn theo nhiều phong cách nghệ thuật khác nhau và lưu chúng vào thư mục Google Drive được chia sẻ.
- Kiểm tra lịch của bạn để xem các cuộc họp với khách hàng sắp tới, sau đó tóm tắt cho bạn những tin tức gần đây có liên quan.
- Lên kế hoạch cho bữa sáng kiểu Nhật cho 4 người, mua tất cả các nguyên liệu cần thiết và cung cấp cho bạn lịch trình cho từng bước của công thức.
- Nghiên cứu 3 đối thủ cạnh tranh, sau đó tạo một bài thuyết trình hoàn chỉnh với những phát hiện.
- Cập nhật mô hình tài chính với các dự báo và công thức, sau đó tóm tắt những giả định chính.
- Thu thập dữ liệu về 7 hệ thống giao thông công cộng toàn cầu và so sánh chúng với hệ thống tại Chicago trong một báo cáo tóm tắt.
- Xem lại lịch của bạn để xem các cuộc gọi với khách hàng, sau đó chuẩn bị một báo cáo và bài thuyết trình về những thay đổi chiến lược.
ChatGPT Agent có tốt không?
ChatGPT Agent lúc thì xuất sắc, lúc lại kém cỏi. Một số người vừa vô cùng ấn tượng, vừa hoàn toàn bối rối trước những gì nó có thể làm. Đây là một ví dụ:
ChatGPT Agent đã chụp ảnh màn hình một kế hoạch tập luyện và chuyển nó thành bảng tính với các cột ghi thông tin như loại bài tập, số lượt, thời lượng, v.v... Đối với một số thông tin, ChatGPT Agent phải chủ động: Không phải bài tập nào cũng ghi rõ thời lượng, vì vậy nó phải tính toán từ số lượt, cũng như thời gian làm việc và nghỉ ngơi. Nó đã làm rất tốt và upload nó lên Google Drive. Một thành công lớn.
Tuy nhiên, sau khi được yêu cầu cung cấp liên kết chia sẻ trên Google Drive, ChatGPT Agent mất tới 22 phút và nó không tìm thấy file vừa upload lên.

Mặt khác, nó đã hoàn thành xuất sắc các nhiệm vụ khó khăn khác. Nó đã tìm cho tác giả một thợ cắt tóc địa phương có lịch trống vào sáng thứ Sáu tuần sau và điều hướng qua hệ thống đặt lịch. Tác giả phải tự thêm thẻ tín dụng, thì sau đó hệ thống mới đặt được chỗ.

Nhưng sau đó, vì là robot nên nó không thể sử dụng Amazon.ie và bị chặn.

Sự không nhất quán này chính là vấn đề khó chịu nhất của ChatGPT. Nếu có thể dự đoán chính xác khả năng của nó, bạn sẽ có khả năng đưa ra quyết định khi nào nên sử dụng và khi nào không, nhưng ngay cả sau nhiều lần thử nghiệm, nhiều người vẫn không thể dự đoán được nhiệm vụ nào nó sẽ dễ dàng thực hiện và nhiệm vụ nào nó sẽ thất bại.
Ngoài ra, ChatGPT hoạt động rất chậm. Nếu muốn có câu trả lời nhanh, tốt hơn hết bạn nên tự tìm hiểu. Đôi khi nó cũng sẽ dừng lại và yêu cầu bạn nhập liệu. Nếu không chú ý, bạn có thể không nhận ra mình cần đăng nhập hoặc giải mã CAPTCHA hay những thứ tương tự. Đây chỉ là những lỗi nhỏ, nhưng việc có những kỳ vọng thực tế là điều đáng giá.
Hiện tại, ChatGPT Agent là một công cụ cực kỳ thú vị, có thể xử lý một số tác vụ, cho thấy nhiều tiềm năng trong việc giải quyết các công việc nhàm chán, và có lẽ không nên để nó hoạt động hoàn toàn mà không có sự giám sát.
Cách dùng thử ChatGPT Agent
ChatGPT Agent có sẵn trong gói ChatGPT Plus với giá 20 USD/tháng. Có một số giới hạn sử dụng, và gói Pro với giá 200 USD/tháng cung cấp quyền truy cập nhiều hơn.
Làm chủ AI
Học IT










Microsoft Word 2013
Microsoft Word 2007
Microsoft Excel 2019
Microsoft Excel 2016
Microsoft PowerPoint 2019
Google Sheets
Lập trình Scratch
Bootstrap
Ô tô, Xe máy