ChatGPT đang nhận được một bản nâng cấp cực kỳ lớn, được thiết kế để tăng tốc cuộc sống của bạn và loại bỏ những tác vụ lặp đi lặp lại, nhàm chán gây xao nhãng khỏi công việc, giải trí và nhiều hơn nữa. Tính năng mới ChatGPT Agent của OpenAI chính thức ra mắt khả năng duyệt web tự động hoàn toàn, hứa hẹn sẽ sớm đến tay người dùng. Đây là một bước tiến vượt bậc, biến ChatGPT từ một công cụ tìm kiếm thông tin thành một trợ lý AI mạnh mẽ, có khả năng tự động hoàn thành các công việc phức tạp với sự can thiệp tối thiểu từ người dùng.
OpenAI Nâng Cấp ChatGPT Trở Nên Cực Kỳ Hữu Ích
ChatGPT đang được trang bị khả năng sử dụng các tác nhân AI tự động hoàn toàn, được biết đến với tên gọi ChatGPT Agent. Hãy hình dung thế này: Cho đến nay, ChatGPT có thể duyệt web và tìm kiếm thông tin cho bạn, nhưng bạn vẫn cần phải tương tác và hướng dẫn quá trình nghiên cứu của nó. Với sự ra mắt của ChatGPT Agent, bức tranh đã thay đổi hoàn toàn.
Giao diện ChatGPT Agent hiển thị các tùy chọn và tương tác trong cửa sổ chat, minh họa khả năng tự động hóa tác vụ.
Giờ đây, ChatGPT Agent có thể tự động hóa hoàn toàn tất cả các quy trình, yêu cầu và tác vụ mà người dùng đưa ra, hoàn thành chúng mà gần như không cần bất kỳ sự can thiệp nào từ phía bạn. Theo nhiều cách, ChatGPT Agent kết hợp hai công cụ trước đây của OpenAI – Operator và Deep Research – để tạo ra một công cụ mạnh mẽ hơn đáng kể, có thể tự động thực hiện các hành động. Operator là nỗ lực trước đây của OpenAI về một tác nhân AI, có khả năng duyệt web, đặt chỗ và hoàn thành một số tác vụ cơ bản. Trong khi đó, Deep Research là một công cụ nghiên cứu chuyên sâu được thiết kế để đi sâu vào bất kỳ yêu cầu nào được đưa ra, tạo ra các báo cáo toàn diện với phân tích dữ liệu từ nhiều nguồn, nhưng nó không được thiết kế cho mức độ tương tác web tương tự như Operator.
Việc kết hợp các công cụ này với sức mạnh của AI tự động hóa mang đến một công cụ có thể hoàn toàn duyệt web cho bạn, có tính đến hầu hết mọi thông tin bạn cung cấp. Bên cạnh đó, ChatGPT Agent có thể truy cập “ChatGPT connectors”, cho phép bạn liên kết các ứng dụng và tài khoản vào tác nhân, nơi nó có thể tìm thấy thông tin cực kỳ cụ thể về bạn và các yêu cầu của bạn. Ví dụ, bạn có thể kết nối Gmail, ứng dụng lịch của mình, v.v., và biến tác nhân AI này thành một trợ lý cá nhân toàn diện.
ChatGPT Agent của OpenAI đang tự động duyệt web, mô phỏng hành vi người dùng để thu thập thông tin và hoàn thành công việc.
Bạn có thể chia nhỏ khả năng của ChatGPT Agent thành ba lĩnh vực chính:
- Tác vụ tự động hóa (Autonomous Tasks): ChatGPT Agent có thể hoàn thành các tác vụ phức tạp, đa bước mà không yêu cầu người dùng phải liên tục cung cấp đầu vào. Điều này giải phóng thời gian và công sức đáng kể cho người dùng.
- Duyệt web (Web Browsing): Tác nhân này có thể duyệt web trong môi trường ChatGPT, mô phỏng chính xác hành vi của một con người với các cú nhấp chuột và chuyển động. Nó cũng có khả năng điều hướng các biểu mẫu, một yếu tố quan trọng trong thế giới internet ngày nay. Về cơ bản, nó là một máy tính ảo trong ChatGPT, với cả giao diện văn bản và trình duyệt đồ họa, mà Agent có thể lựa chọn sử dụng.
- Công cụ (Tools): OpenAI đã xác nhận rằng ChatGPT Agent có thể sử dụng tất cả các công cụ đã có sẵn để hoàn thành các tác vụ của mình, chẳng hạn như truy cập API, các thao tác tệp, nhập dữ liệu, suy luận và thậm chí lập trình để hoàn thành công việc. Ví dụ, Agent có quyền truy cập vào terminal riêng để thực hiện các tác vụ cụ thể hoặc sử dụng AI tạo sinh để tạo ra hình ảnh độc đáo.
Minh họa ChatGPT Agent của OpenAI sử dụng các 'kết nối' để tích hợp với ứng dụng bên thứ ba, nâng cao khả năng trợ lý cá nhân.
Đây là mô hình đầu tiên mà OpenAI đã huấn luyện có thể chuyển đổi liền mạch giữa các chức năng khác nhau này và “hộp công cụ thống nhất”. Sử dụng học tăng cường (reinforcement learning), Agent có thể tự quyết định khi nào sử dụng bất kỳ công cụ nào trong số các công cụ sẵn có của mình, cho phép nó xử lý các yêu cầu và tác vụ phức tạp từng bước một. Theo thời gian, nó sẽ trở nên hiệu quả hơn trong việc hoàn thành tác vụ, đẩy nhanh quá trình và tăng độ chính xác.
ChatGPT Agent Có Hoàn Thành Tác Vụ Mà Không Cần Hỏi Không? Vấn Đề Bảo Mật Thì Sao?
Buổi phát trực tiếp của OpenAI đã làm nổi bật một vài tính năng bảo mật quan trọng được tích hợp vào ChatGPT Agent.
Đầu tiên, mặc dù nó có thể hoàn thành các tác vụ theo yêu cầu, nhưng nó sẽ nhắc nhở bạn khi cần gửi biểu mẫu, đăng nhập vào trang web và các tác vụ quan trọng khác. Những điểm dừng này được thiết kế để ngăn chặn các vấn đề phát sinh cụ thể trong các tình huống này. Tự động hóa là điều tuyệt vời, nhưng hiện tại, sự can thiệp của người dùng vẫn rất quan trọng đối với các hành động nhạy cảm.
OpenAI cũng đã huấn luyện Agent từ chối các yêu cầu nguy hiểm, không an toàn hoặc mơ hồ mà nó không thể thực hiện. Điều này được điều chỉnh chặt chẽ với các tiêu chuẩn an toàn hiện có của OpenAI, đảm bảo rằng nó không đi quá xa khỏi các giới hạn hiện tại của ChatGPT. Điều này chắc chắn sẽ khiến một số người cho rằng ChatGPT đã bị khóa quá chặt, nhưng đây là điều hợp lý khi tung ra các tác nhân AI tự động ra thế giới. Hơn nữa, tại thời điểm ra mắt, nó sẽ không thực hiện bất kỳ giao dịch mua nào mà không có sự xác nhận.
Agent cũng đi kèm với một số công cụ mới để bảo vệ chống lại lỗi prompt injection, một loại tấn công độc hại mới tập trung vào các công cụ AI. Prompt injection là một vấn đề đối với tất cả các loại AI tạo sinh, nhưng đặc biệt đáng lo ngại khi các công cụ này sẽ bắt đầu duyệt web một cách tự động.
Về vấn đề này, OpenAI đã tích hợp một số biện pháp bảo vệ mới vào Agent. Ví dụ, ChatGPT Agent chạy trong môi trường sandbox (hộp cát). Mặc dù nó có thể thay đổi lịch của bạn, tải xuống tệp, v.v., OpenAI không muốn nó tương tác trực tiếp với hệ điều hành của bạn ở mức độ có thể gây hại, vì vậy họ cách ly công cụ này. Ngoài ra, nó sử dụng các bộ phân loại cụ thể để xác định các cuộc tấn công prompt injection và các loại thao túng khác, và được thiết kế để ngăn chặn chúng.
Khi Nào ChatGPT Agent Ra Mắt?
Thực tế, trong một khoảnh khắc hiếm hoi đối với OpenAI, Sam Altman đã xác nhận rằng Agent đang được ra mắt ngay lập tức. Người đăng ký ChatGPT Pro sẽ nhận được 400 truy vấn mỗi tháng, trong khi người đăng ký Plus và Team có giới hạn hơn với 40 yêu cầu.
Tuy nhiên, giống như hầu hết các tính năng mới của ChatGPT, ngay cả khi nó được ra mắt ngay lập tức, vẫn mất vài ngày để tính năng này đến được tài khoản cụ thể của bạn, ngay cả khi bạn đã đăng ký một trong các gói nêu trên.
Đừng quên rằng, không gian duyệt web tự động dựa trên AI đang rất sôi động. Đầu năm 2025, Opera đã ra mắt trình duyệt Neon ấn tượng của mình với khả năng AI tự động hóa, trong khi Perplexity cũng đang thử nghiệm trình duyệt Comet được hỗ trợ bởi AI. Và không thể không nhắc đến gã khổng lồ chống virus Norton, dự kiến sẽ ra mắt Neo, một trình duyệt hỗ trợ AI khác, vào khoảng năm 2025. Như đã nói, các trình duyệt hỗ trợ AI đã xuất hiện và chúng đang ồ ạt đổ bộ!
Kết Luận
ChatGPT Agent đánh dấu một cột mốc quan trọng trong sự phát triển của trí tuệ nhân tạo, mang đến khả năng tự động hóa tác vụ và duyệt web vượt trội. Với sự kết hợp của Operator và Deep Research, cùng với khả năng truy cập các công cụ đa dạng và biện pháp bảo mật chặt chẽ, ChatGPT Agent hứa hẹn sẽ trở thành một trợ lý cá nhân và công cụ làm việc không thể thiếu, giúp người dùng tiết kiệm thời gian và nâng cao hiệu suất đáng kể. Dù thị trường trình duyệt AI đang ngày càng cạnh tranh, sự ra mắt ngay lập tức của Agent khẳng định vị thế tiên phong của OpenAI. Bạn đã sẵn sàng trải nghiệm kỷ nguyên mới của AI tự động hóa chưa? Hãy chia sẻ suy nghĩ của bạn về bản nâng cấp đột phá này và cách bạn hình dung nó sẽ thay đổi công việc hàng ngày của mình trong phần bình luận bên dưới!