Imagen 3 của Google, một trong những mô hình AI chuyển văn bản thành hình ảnh mạnh mẽ nhất, đã có mặt trên các ứng dụng Gemini từ lâu, nhưng vẫn còn những giới hạn nhất định. Cụ thể, việc tạo ra hình ảnh người trước đây là một “đặc quyền” chỉ dành cho người dùng trả phí. Tuy nhiên, tình hình đã thay đổi. Giờ đây, hầu hết người dùng Gemini miễn phí tại Việt Nam và trên toàn cầu đã có thể thỏa sức sáng tạo với tính năng tạo ảnh AI có người, mở ra nhiều khả năng mới mẻ.
Tính Năng Tạo Ảnh Người Trên Gemini: Từ Độc Quyền Đến Miễn Phí
Nếu bạn đã từng sử dụng ứng dụng web, máy tính hoặc di động của Gemini, chắc hẳn bạn đã trải nghiệm khả năng tạo hình ảnh của nó, được hỗ trợ bởi mô hình Imagen 3 của Google. Google đã chính thức phát hành công cụ này cho tất cả người dùng vào tháng 8 năm 2024, với các tùy chọn đa dạng từ “phong cảnh siêu thực” đến “cảnh đất sét sống động”, theo thông báo trên The Keyword của Google.
Tuy nhiên, việc tạo hình ảnh có người lại là một câu chuyện khác. Google đã giới hạn việc triển khai tính năng cụ thể này cho những người đăng ký trả phí, bao gồm người dùng Gemini Advanced, Business và Enterprise. Nếu bạn sử dụng tài khoản miễn phí, mỗi khi yêu cầu Gemini tạo hình ảnh có người, bạn sẽ nhận được thông báo tương tự: “Tính năng tạo hình ảnh người chỉ khả dụng trong quyền truy cập sớm với Gemini Advanced. Hãy đăng ký Advanced để có quyền truy cập sớm vào các tính năng mới của Gemini tại đây.”
Đến tháng 2 năm 2025, hầu hết người dùng Gemini miễn phí đã có thể tạo hình ảnh có người một cách thành công. Mặc dù vậy, nếu bạn vẫn nhận được thông báo lỗi, có thể tính năng này vẫn đang trên đường được triển khai đến tài khoản của bạn. Có vẻ như Google đang triển khai dần dần, bắt đầu với người dùng tại Mỹ sử dụng Gemini với ngôn ngữ tiếng Anh.
Người dùng sử dụng Gemini để tạo ảnh một phụ nữ đang ăn kem, minh họa tính năng tạo ảnh người bằng Imagen 3.
Cần lưu ý rằng theo các hướng dẫn chính sách của Gemini, bạn vẫn không thể tạo ra hình ảnh chân thực về những người có thể nhận dạng hoặc trẻ em. Điều này nhằm đảm bảo tính đạo đức và an toàn trong việc sử dụng AI.
Imagen 3 Hoạt Động Thế Nào Trên Gemini 2.0 Flash?
Cũng trong tháng 2 năm 2025, Google đã phát hành rộng rãi mô hình Gemini nhanh nhất của mình cho người dùng miễn phí, được gọi là Gemini 2.0 Flash. Google mô tả mô hình này là một “công cụ mạnh mẽ hiệu quả cao”, hứa hẹn mang lại những cải tiến đáng kể cho việc tạo hình ảnh. Thông thường, việc tạo hình ảnh AI đòi hỏi nhiều năng lượng và thời gian hơn so với tạo văn bản. Do đó, về mặt lý thuyết, hình ảnh AI có thể đạt được chất lượng cao hơn khi được cung cấp bởi một mô hình mạnh mẽ như Gemini 2.0 Flash.
Chất lượng dường như đặc biệt quan trọng khi nói đến việc tạo hình ảnh người. Chúng ta đều đã chứng kiến những hình ảnh người do AI tạo ra ở giai đoạn đầu với những bàn tay méo mó, thêm chi hoặc đôi mắt vô hồn. Vì vậy, sự e dè khi tin tưởng vào công cụ tạo hình ảnh AI của Google với tư cách là người dùng miễn phí là điều dễ hiểu.
Bộ sưu tập các hình ảnh AI được Gemini tạo ra, thể hiện khả năng đa dạng của công cụ.
Trái ngược với những lo ngại ban đầu, chúng tôi thực sự ấn tượng bởi khả năng của Gemini khi xử lý các yêu cầu tạo hình ảnh có người. Đặc biệt khi xem xét rằng đây là một dịch vụ miễn phí, chúng tôi nhận thấy những hình ảnh đầu tiên rất cao cấp, chân thực và phù hợp với mô tả được cung cấp. Bạn có thể yêu cầu Gemini tiếp tục chỉnh sửa một hình ảnh mà không cần phải bắt đầu lại từ đầu mỗi lần, đây là một tính năng tiện lợi giúp tối ưu hóa quy trình sáng tạo.
Ví dụ hình ảnh AI chất lượng cao do Gemini tạo ra về một phụ nữ đang ăn kem, minh họa độ chân thực của Imagen 3.
Kết Luận
Việc có thể truy cập Imagen 3 thông qua Gemini miễn phí chắc chắn là một trải nghiệm thú vị, nhưng việc phải tránh tạo hình ảnh người trước đây là một hạn chế đáng kể. Bản cập nhật mới nhất của Google đã mở rộng “sân chơi” cho người dùng, và khiến dịch vụ miễn phí của Gemini trở thành một đối thủ đáng gờm cho các dịch vụ trả phí như Midjourney. Mặc dù các dịch vụ trả phí sẽ có nhiều tùy chọn nâng cao hơn, chẳng hạn như kích thước hình ảnh tùy chỉnh, cách tiếp cận của Gemini lại dễ dàng và sẵn sàng sử dụng. Với rất nhiều tính năng miễn phí được cung cấp, điều này khiến chúng ta phải tự hỏi liệu việc truy cập sớm các tính năng có còn đủ để người dùng chi trả cho Gemini Advanced hay không. Hãy trải nghiệm ngay tính năng mới này và chia sẻ cảm nhận của bạn nhé!