OpenAI đã hứa hẹn năm 2025 sẽ là một năm bùng nổ cho sự phát triển của trí tuệ nhân tạo, và sự ra mắt của tác nhân AI đầu tiên của họ, Operator, chắc chắn đã đáp ứng kỳ vọng đó. Công cụ AI tự động này sẽ tự động thực hiện các tác vụ trực tuyến cho bạn, đánh dấu sự khởi đầu của thế hệ AI tiếp theo với khả năng vượt trội, mang lại tiện ích to lớn cho người dùng toàn cầu.
OpenAI Operator: Khả Năng Vượt Trội Dành Riêng Cho Người Dùng ChatGPT Pro
Tác nhân AI Operator của OpenAI được thiết kế để tìm kiếm trên web và hoàn thành các tác vụ do người dùng giao phó. Nó sở hữu một trình duyệt tích hợp, cho phép thực hiện nhiều công việc khác nhau như đặt bàn ăn, mua sắm một món hàng, điền biểu mẫu, và nhiều hơn nữa. OpenAI đang hợp tác chặt chẽ với một số công ty lớn, bao gồm DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack và Uber, nhằm đảm bảo Operator có thể ứng dụng hiệu quả vào các tình huống thực tế.
Giao diện minh họa cách OpenAI Operator thực hiện các tác vụ tự động trên trình duyệt web, bao gồm đặt bàn và mua sắm trực tuyến.
Một bài đăng trên blog của OpenAI đã mô tả chi tiết hơn về cách thức hoạt động của Operator:
Operator có thể “nhìn” (thông qua ảnh chụp màn hình) và “tương tác” (sử dụng tất cả các hành động mà chuột và bàn phím cho phép) với một trình duyệt, cho phép nó thực hiện hành động trên web mà không yêu cầu tích hợp API tùy chỉnh.
Nếu gặp phải thử thách hoặc mắc lỗi, Operator có thể tận dụng khả năng suy luận của mình để tự điều chỉnh. Khi bị kẹt và cần hỗ trợ, nó chỉ đơn giản là chuyển quyền kiểm soát lại cho người dùng, đảm bảo trải nghiệm mượt mà và cộng tác.
Cùng với một số lời nhắc cài đặt sẵn, người dùng cũng có thể thêm các hướng dẫn tùy chỉnh. Operator còn có khả năng chạy nhiều tác vụ đồng thời, tối ưu hóa hiệu suất làm việc.
Tuy nhiên, tác nhân AI này vẫn còn những hạn chế. OpenAI cho biết Operator hiện gặp vấn đề với các giao diện phức tạp, chẳng hạn như quản lý lịch. Dù vậy, nếu không thể hoàn thành một tác vụ, Operator sẽ “chuyển quyền kiểm soát lại cho người dùng,” cho phép bạn tiếp tục công việc. Điều này có thể gây đôi chút khó chịu ban đầu, nhưng Operator chắc chắn sẽ cải thiện theo thời gian, đặc biệt là khi có nhiều người dùng bắt đầu sử dụng.
Tại thời điểm viết bài, Operator hiện chỉ khả dụng dưới dạng “bản xem trước nghiên cứu” cho bất kỳ ai đăng ký gói Pro trị giá 200 USD mỗi tháng, được ra mắt vào tháng 12 năm 2024. Trong tương lai, công cụ này sẽ được cung cấp cho người dùng các gói Plus, Team và Enterprise. Cuối cùng, Operator cũng sẽ được tích hợp trực tiếp vào ChatGPT, mở rộng phạm vi tiếp cận đáng kể.
Operator Mở Ra Kỷ Nguyên Mới Của Trí Tuệ Nhân Tạo Tự Động
Trong khi ChatGPT và các chatbot khác trước đây hoạt động thụ động và yêu cầu người dùng dẫn dắt tương tác, Operator là một thế hệ AI mới. Việc đưa AI vào làm việc để thực hiện các tác vụ trên web có thể làm cho công nghệ trở nên hữu ích hơn nữa trong cuộc sống hàng ngày. Ví dụ, OpenAI cho biết bạn có thể “chỉ cần mô tả tác vụ bạn muốn thực hiện và Operator có thể xử lý phần còn lại.” Tuy nhiên, bạn sẽ phải có mặt để hoàn tất các khoản thanh toán, giải mã CAPTCHA và các tác vụ tương tự yêu cầu sự can thiệp của con người.
OpenAI đang đặt cược rất lớn vào các tác nhân AI. Trong một bài đăng trên blog vào cuối năm 2024, CEO Sam Altman đã nói rằng các tác nhân AI có thể gia nhập lực lượng lao động vào năm 2025, và Operator là một dấu hiệu rõ ràng cho thấy điều đó đang dần trở thành hiện thực.