So sánh ChatGPT Atlas và Perplexity Comet

Trình duyệt AI được cho là tương lai của web. Lời quảng cáo như sau: Những trang web sẽ ngừng được thiết kế cho con người và bắt đầu được thiết kế cho các AI agent, với cấu trúc gọn gàng, các nút dễ dự đoán và ý định có thể đọc được bằng máy. Bạn sẽ không còn duyệt web nữa, mà sẽ ra lệnh. Agent sẽ quét, nhấp chuột, so sánh và quyết định thay mặt bạn. Tương lai đó có thể sẽ đến, nhưng hiện tại vẫn còn rất xa vời.

Hai trong số những nỗ lực nổi bật nhất hướng tới ý tưởng trình duyệt agentic là Comet của PerplexityAtlas của OpenAI. Cả hai đều hứa hẹn sẽ hành động thay mặt bạn ngay trong trình duyệt. Vì vậy, hãy thử nghiệm chúng song song, sử dụng cùng một prompt, trên cùng một trang web, với cùng các ràng buộc. Cái nào hoạt động tốt nhất? Câu trả lời ngắn gọn: Chúng không giống nhau. Một trong số chúng luôn hoạt động tốt, nhanh và ít lỗi hơn.

Mua kính râm

Hiếm khi có lỗi, kích thước không chắc chắn

Nhiệm vụ khá đơn giản nhưng thực tế. Tác giả bài viết đã upload lên bức ảnh một cặp kính râm và yêu cầu agent tìm các sản phẩm trông tương tự trên một trang web mua sắm. Các ràng buộc rất rõ ràng: Thương hiệu uy tín, ít nhất xếp hạng 4 sao với 500 đánh giá trở lên, dưới 100 USD, cùng 3 lựa chọn cụ thể với liên kết và giá cả.

Atlas hoàn thành nhiệm vụ trong 1 phút 58 giây. Nhưng 2 trong số 3 liên kết bị hỏng. Tìm kiếm thủ công tên sản phẩm cho thấy không có sản phẩm nào thực sự gần giống với chiếc kính gốc trong ảnh.

Comet không hoàn thành nhiệm vụ và phải dừng lại ở phút thứ 5. Trong khi Atlas phân tích hình ảnh và hành động dựa trên sự hiểu biết đó, Comet dường như hoàn toàn mất phương hướng. Nó bị kẹt trong vòng cuộn vô tận của Amazon, liên tục load thêm các mặt hàng mà không tìm thấy bất kỳ thứ gì hữu ích.

Agent

Thời gian

Có hoàn thành nhiệm vụ không?

Kết quả

Atlas

1:58

Tệ

Comet

5:00 (buộc dừng)

Không

Kinh khủng

Phân tích bảng tính và lập biểu đồ

Số liệu cần được tôn trọng

Tiếp theo là một nhiệm vụ về năng suất. Sử dụng một bảng tính đã mở sẵn, agent phải tóm tắt dữ liệu, chọn loại biểu đồ chính xác để hiển thị mối quan hệ giữa trọng lượng, mã lực và gia tốc từ 0 – 100, và sau đó thực sự xây dựng biểu đồ đó.

Atlas hoàn thành nhiệm vụ trong 2 phút 13 giây. Nó đã chọn biểu đồ bong bóng, ánh xạ chính xác trục X và Y, và đặt kích thước bong bóng phù hợp. Kết quả cuối cùng gọn gàng, dễ đọc và chính xác.

Comet hoàn thành nhiệm vụ trong 4 phút 5 giây. Nó cũng chọn biểu đồ bong bóng, đó là lựa chọn đúng. Tuy nhiên, nó để tất cả các nhãn dữ liệu được hiển thị, khiến biểu đồ gần như không thể đọc được. Về mặt kỹ thuật, chương trình đã hoàn thành nhiệm vụ, nhưng kết quả đầu ra cần được chỉnh sửa thủ công để có thể sử dụng được.

Agent

Thời gian

Có hoàn thành nhiệm vụ không?

Kết quả

Atlas

2:13

Tốt

Comet

4:05

Tệ

Lên lịch họp

Chủ yếu là nhờ vào sự hỗ trợ của lịch

Nhiệm vụ này kiểm tra khả năng phối hợp nhiều bước giữa các dịch vụ. Nhân viên cần tạo sự kiện trên Google Calendar cho ngày hôm sau lúc 9:00 sáng, đặt tên phù hợp, đính kèm bảng tính đang được thảo luận, viết mô tả ngắn gọn giải thích về bảng tính, và sau đó xác nhận sự kiện đã được tạo.

Atlas hoàn thành trong 2 phút 48 giây. Nó mở Google Calendar trong một tab mới, tạo sự kiện đúng giờ và đặt tên là “Cars & Specs Discussion". Nó mở bảng đính kèm, tìm thấy bảng tính trong Google Drive, đính kèm, viết mô tả ngắn gọn và lưu sự kiện. Mọi thứ hoạt động như mong đợi, từ đầu đến cuối.

Comet hoàn thành trong 2 phút 53 giây. Nó thực hiện theo quy trình tương tự, đặt tên sự kiện là “Car Engines and Specs Review”. Nó viết mô tả bằng các gạch đầu dòng, điều này không được yêu cầu nhưng cũng không gây hại. Tuy nhiên, thay vì đính kèm trực tiếp file, nó đã dán liên kết đến bảng tính vào phần mô tả. Về mặt kỹ thuật, nhiệm vụ đã hoàn thành, nhưng kém trau chuốt hơn một chút.

Agent

Thời gian

Có hoàn thành nhiệm vụ không?

Kết quả

Atlas

2:48

Tuyệt vời

Comet

2:53

Tốt

Tóm tắt email

Mục tiêu ở đây là phân loại. Công cụ cần xem hộp thư đến của bạn, tóm tắt những email chưa đọc gần nhất không phải là thông báo tự động, nhóm chúng theo chủ đề hoặc người gửi, đánh dấu bất kỳ email nào khẩn cấp và liệt kê các hành động được đề xuất.

Atlas hoàn thành nhiệm vụ trong 2 phút 18 giây. Nó sử dụng phương pháp "cưỡng chế", nhấp chuột vào từng email chưa đọc một. Bản tóm tắt cuối cùng ngắn gọn, dễ đọc, và nó thực sự giống như bản tóm tắt hơn là một đống thông tin.

Comet hoàn thành nhiệm vụ trong 4 phút 43 giây. Nó bắt đầu bằng cách chọn tất cả email, sau đó dành cả 1 phút để tìm cách bỏ chọn chúng. Nó dừng lại sớm, sau đó tạo ra một bản tóm tắt chủ yếu là các email tự động đã được yêu cầu loại trừ một cách rõ ràng.

Agent

Thời gian

Có hoàn thành nhiệm vụ không?

Kết quả

Atlas

2:18

Tốt

Comet

4:43

Tệ

Thêm sách vào Goodreads

Đây là nhiệm vụ đơn giản nhất: Thêm một cuốn sách cụ thể vào danh sách “Want to Read” trên Goodreads.

Atlas hoàn thành trong 54 giây. Ban đầu, nó tìm kiếm bằng tiêu đề đầy đủ và tên tác giả, kết quả hiển thị là các tài liệu hướng dẫn học tập thay vì chính cuốn sách. Hơi vòng vo, nhưng hiệu quả.

Comet hoàn thành trong 59 giây. Nó mở Goodreads, tìm kiếm “Neuromancer”, chọn kết quả đầu tiên và thêm vào. Ít lỗi hơn Atlas, nhưng vẫn mất thời gian lâu hơn một chút.

Agent

Thời gian

Có hoàn thành nhiệm vụ không?

Kết quả

Atlas

00:54

Xuất sắc

Comet

00:59

Xuất sắc

Perplexity đã làm điều đó trước, nhưng OpenAI làm tốt hơn

Comet là một trong những trình duyệt agentic AI đầu tiên. Nhiều người không thích thuật ngữ đó - nó nghe giống như từ ngữ sáo rỗng của doanh nghiệp được ngụy trang thành sự đổi mới - nhưng đó là danh mục mà chúng ta buộc phải sử dụng. Ở trạng thái hiện tại, các agent này bị hạn chế rất nhiều. Chúng có thể thực hiện các tác vụ, nhưng trong hầu hết mọi trường hợp, bạn sẽ nhanh hơn và ít bực bội hơn nếu tự mình làm việc đó.

Ngay cả khi một agent về mặt kỹ thuật tiết kiệm thời gian, thì chi phí phải viết một prompt chính xác thường làm mất đi lợi ích đó.

Chúng thú vị như những thử nghiệm, và hấp dẫn như những ý tưởng, nhưng chúng chưa sẵn sàng. Trong hai công cụ này, Atlas của OpenAI rõ ràng là tùy chọn chiến thắng - không phải vì nó hoàn hảo, mà vì nó ít gặp sự cố nghiêm trọng hơn, phục hồi mượt mà hơn và cho ra kết quả thường xuyên hơn, sát với những gì bạn thực sự yêu cầu. Đây chưa phải là tương lai của việc duyệt web, nhưng nó đang tiến gần hơn đến điều đó!

Thứ Hai, 23/02/2026 17:35
31 👨 4
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
    ❖ ChatGPT