ChatGPT đang nhận được một bản nâng cấp khổng lồ, được thiết kế để tăng tốc cuộc sống và loại bỏ những tác vụ lặp lại, tẻ nhạt, giúp chúng ta tập trung hơn vào công việc, giải trí và nhiều hơn thế nữa. Tính năng mới ChatGPT Agent sẽ ra mắt khả năng duyệt web tự động hoàn toàn, được hỗ trợ bởi các tác nhân AI, và hứa hẹn sẽ sớm đến tay người dùng. Đây là một bước tiến mang tính cách mạng, biến ChatGPT thành một trợ lý cá nhân mạnh mẽ và độc lập hơn bao giờ hết.
ChatGPT Agent: Bước Tiến Vượt Bậc Của Trí Tuệ Nhân Tạo
ChatGPT đang được trang bị khả năng sử dụng các tác nhân AI hoàn toàn tự động, được gọi là ChatGPT Agent. Cho đến nay, ChatGPT có thể duyệt web và tìm thông tin cho bạn, nhưng bạn vẫn cần tham gia và hướng dẫn quá trình nghiên cứu. Với ChatGPT Agent, mọi quy trình, yêu cầu và tác vụ đều có thể được tự động hóa hoàn toàn, hoàn thành với gần như không cần sự can thiệp của người dùng. ChatGPT Agent kết hợp hai công cụ trước đây của OpenAI là Operator và Deep Research để tạo ra một công cụ mạnh mẽ hơn đáng kể, có thể tự chủ hoàn thành các hành động. Operator là nỗ lực trước đây của OpenAI về một tác nhân AI, có khả năng duyệt web, đặt chỗ và hoàn thành một số tác vụ cơ bản. Trong khi đó, Deep Research là một công cụ nghiên cứu chuyên sâu, được thiết kế để đi sâu vào bất kỳ yêu cầu nào, tạo ra các báo cáo toàn diện với phân tích dữ liệu từ nhiều nguồn, nhưng không được thiết kế cho mức độ tương tác web như Operator.
Giao diện ChatGPT Agent đang chọn và thực hiện tác vụ tự động trong cửa sổ trò chuyện
Việc kết hợp những công cụ này với sức mạnh của AI tác nhân mang đến một công cụ có thể duyệt web hoàn toàn tự động, có tính đến hầu hết mọi thông tin bạn cung cấp. Ngoài ra, ChatGPT Agent có thể truy cập “ChatGPT connectors”, cho phép bạn liên kết các ứng dụng và tài khoản vào tác nhân, nơi nó có thể tìm thấy thông tin cụ thể về bạn và các yêu cầu của bạn. Ví dụ, bạn có thể kết nối Gmail, ứng dụng lịch của mình, và biến AI tác nhân thành một trợ lý cá nhân toàn diện.
Ba Khả Năng Cốt Lõi Của ChatGPT Agent
ChatGPT Agent được thiết kế với ba lĩnh vực khả năng chính, làm nổi bật sức mạnh và tính linh hoạt của nó:
- Tác vụ Tự động hóa (Autonomous Tasks): ChatGPT Agent có thể hoàn thành các tác vụ phức tạp, nhiều bước mà không yêu cầu sự nhập liệu liên tục từ người dùng. Điều này mở ra khả năng tự động hóa chuỗi công việc dài, tiết kiệm đáng kể thời gian và công sức.
- Duyệt web (Web Browsing): Tác nhân có thể duyệt web bên trong ChatGPT, bắt chước chính xác một người thật với các cú nhấp chuột và thao tác. Nó cũng có thể điều hướng các biểu mẫu, một yếu tố quan trọng trong internet hiện nay. Đây là một máy tính ảo trong ChatGPT, có cả giao diện dựa trên văn bản và trình duyệt trực quan mà Agent có thể chọn sử dụng.
- Sử dụng Công cụ (Tools): OpenAI đã xác nhận rằng ChatGPT Agent có thể sử dụng tất cả các công cụ đã có sẵn để hoàn thành các tác vụ của mình, chẳng hạn như truy cập API, thao tác tệp, nhập dữ liệu, suy luận và thậm chí lập trình để hoàn thành công việc. Ví dụ, Agent có quyền truy cập vào terminal riêng để làm việc trên các tác vụ cụ thể hoặc sử dụng AI tạo sinh để tạo ra hình ảnh độc đáo.
ChatGPT Agent của OpenAI đang tự động duyệt web và thực hiện các thao tác tìm kiếm thông tin
Đây là mô hình đầu tiên mà OpenAI đã đào tạo có thể di chuyển liền mạch giữa các chức năng khác nhau và “hộp công cụ hợp nhất” này. Sử dụng học tăng cường (reinforcement learning), Agent có thể quyết định khi nào nên sử dụng bất kỳ công cụ nào có sẵn, cho phép nó xử lý các yêu cầu và tác vụ phức tạp từng bước một. Theo thời gian, nó sẽ trở nên hiệu quả hơn trong việc hoàn thành các tác vụ, tăng tốc quá trình và nâng cao độ chính xác.
Bảo Mật Và An Toàn Trên ChatGPT Agent
OpenAI đã nhấn mạnh một số tính năng bảo mật chính được tích hợp vào ChatGPT Agent trong buổi phát trực tiếp.
Đầu tiên, mặc dù nó có thể hoàn thành các tác vụ theo yêu cầu, nhưng nó sẽ nhắc bạn khi đến lúc gửi biểu mẫu, đăng nhập vào trang web và các tác vụ quan trọng khác. Những điểm dừng này được thiết kế để ngăn chặn các vấn đề phát sinh cụ thể trong những tình huống này. Tự động hóa thật tuyệt vời, nhưng ở thời điểm hiện tại, sự can thiệp của người dùng vẫn rất quan trọng.
OpenAI cũng đã huấn luyện Agent từ chối các yêu cầu nguy hiểm, không an toàn hoặc mơ hồ mà nó không thể thực hiện. Điều này được điều chỉnh chặt chẽ với các tiêu chuẩn an toàn hiện có của OpenAI, đảm bảo nó không đi quá xa giới hạn hiện tại của ChatGPT. Điều này chắc chắn sẽ làm một số người khó chịu vì cho rằng ChatGPT đã quá bị “khóa”, nhưng điều này là hợp lý khi đưa các tác nhân AI tự động ra thế giới. Hơn nữa, khi ra mắt, nó sẽ không thực hiện bất kỳ giao dịch mua nào mà không có xác nhận.
ChatGPT Agent của OpenAI sử dụng các kết nối để truy cập ứng dụng và tài khoản, minh họa tính năng tự động
Agent cũng đi kèm với một số công cụ mới để bảo vệ chống lại prompt injection (tiêm nhiễm lời nhắc), một loại tấn công độc hại mới tập trung vào các công cụ AI. Prompt injection là một vấn đề đối với tất cả các loại AI tạo sinh, nhưng lại là một mối lo ngại đặc biệt khi những công cụ này bắt đầu tự động duyệt web. OpenAI đã tích hợp một số biện pháp bảo vệ mới vào Agent. Ví dụ, ChatGPT Agent chạy trong một môi trường sandbox (hộp cát). Mặc dù nó có thể thay đổi lịch của bạn, tải xuống tệp, v.v., OpenAI không muốn nó tương tác trực tiếp với hệ điều hành của bạn ở mức độ có thể gây hại, vì vậy nó cô lập công cụ. Ngoài ra, nó sử dụng các bộ phân loại cụ thể để xác định các cuộc tấn công prompt injection và các loại thao tác khác, và được thiết kế để ngăn chặn chúng.
Thời Điểm Ra Mắt Và Các Gói Dịch Vụ
Trong một khoảnh khắc hiếm hoi đối với OpenAI, Sam Altman đã xác nhận rằng Agent sẽ ra mắt ngay lập tức. Người đăng ký ChatGPT Pro sẽ nhận được 400 truy vấn mỗi tháng, trong khi người đăng ký Plus và Team có giới hạn hơn là 40 yêu cầu. Tuy nhiên, giống như hầu hết các tính năng mới của ChatGPT, ngay cả khi nó ra mắt ngay lập tức, vẫn mất vài ngày để tính năng này được cập nhật đến tài khoản của bạn, ngay cả khi bạn đã đăng ký một trong các gói trên.
Đừng quên, không gian duyệt web bằng tác nhân AI trên trình duyệt đang rất sôi động. Đầu năm 2025, Opera đã ra mắt trình duyệt Neon hỗ trợ AI tác nhân ấn tượng của mình, trong khi Perplexity cũng đang thử nghiệm trình duyệt Comet được hỗ trợ AI. Và không thể không nhắc đến gã khổng lồ chống virus Norton cũng sẽ ra mắt Neo, một trình duyệt hỗ trợ AI khác, vào khoảng năm 2025. Như đã nói, các trình duyệt hỗ trợ AI đã có mặt, và chúng đang đến rất nhiều!
Kết Luận
Sự ra đời của ChatGPT Agent đánh dấu một bước tiến lớn trong khả năng tự động hóa và tương tác của AI với thế giới kỹ thuật số. Với khả năng thực hiện tác vụ phức tạp, duyệt web thông minh và tích hợp công cụ đa dạng, Agent không chỉ nâng cao trải nghiệm người dùng mà còn định hình lại cách chúng ta làm việc và quản lý cuộc sống. Mặc dù vẫn còn những lo ngại về bảo mật, OpenAI đã và đang nỗ lực tối đa để đảm bảo an toàn cho người dùng. Đây chắc chắn là một công nghệ đáng để theo dõi và trải nghiệm trong tương lai gần.