DALL-E, công cụ tạo ảnh bằng trí tuệ nhân tạo (AI) của OpenAI, đã có những bước tiến vượt bậc kể từ khi ra mắt, mở ra khả năng sáng tạo không giới hạn cho người dùng. Từ việc biến văn bản thành hình ảnh độc đáo đến hỗ trợ ý tưởng thiết kế, DALL-E thực sự là một trợ thủ đắc lực trong lĩnh vực AI tạo ảnh. Tuy nhiên, dù sở hữu nhiều tính năng ấn tượng, DALL-E vẫn còn tồn tại không ít hạn chế của DALL-E và vấn đề thường gặp phải khi dùng AI tạo ảnh này. Những nhược điểm DALL-E này trở nên rõ ràng hơn khi bạn sử dụng nó thường xuyên, từ việc thiếu nhất quán đến kích thước ảnh không chính xác. Bài viết này sẽ đi sâu vào 9 lỗi DALL-E phổ biến mà bạn có thể gặp phải, giúp bạn hiểu rõ hơn về những giới hạn của công cụ này và cách tối ưu trải nghiệm sáng tạo của mình.
1. DALL-E Vẫn Gặp Khó Khăn Với Chữ Viết
Trong khi các công cụ AI nói chung vẫn chưa hoàn hảo trong việc tạo văn bản trong hình ảnh, tôi tin rằng sau khi thử nghiệm hàng chục trình tạo ảnh AI, DALL-E là một trong những công cụ tệ nhất ở khía cạnh này. Bạn thường sẽ có kết quả tốt hơn với các yêu cầu đơn giản, nhưng như bạn có thể thấy bên dưới, phần mềm vẫn gặp khó khăn khi viết đúng dấu huyền trong từ “Café”.
Ảnh quán cà phê với biển hiệu có lỗi dấu tiếng Pháp do DALL-E tạo ra
Trong nhiều thử nghiệm, DALL-E cũng đã viết sai chính tả văn bản mà tôi cung cấp – mặc dù tôi đã đưa ra các prompt rất rõ ràng và thử nhiều lần để khắc phục vấn đề này. Trong các trường hợp khác, văn bản còn bị méo mó và khó đọc. Bạn cũng sẽ nhận thấy DALL-E không tạo ra văn bản rõ ràng cho các biển báo đường phố và các vật thể tương tự.
2. Không Thay Đổi Kích Thước Ảnh Theo Yêu Cầu
DALL-E hiểu khá tốt nhu cầu tạo ra một hình ảnh, nhưng nó lại khá tệ trong việc thay đổi kích thước chúng khi được yêu cầu. Ví dụ, tôi đã yêu cầu phần mềm nhiều lần thay đổi kích thước hình ảnh cho các blog khác nhau; mỗi lần, DALL-E chỉ đơn thuần tạo lại bức ảnh đó.
May mắn thay, việc cắt và thay đổi kích thước hình ảnh khá đơn giản. Nhiều công cụ miễn phí, như Canva, cho phép bạn thực hiện điều này. Tuy nhiên, sẽ rất tiện lợi nếu có thể làm được mà không cần phải dựa vào phần mềm của bên thứ ba.
3. Khó Khăn Trong Việc Tạo Ảnh Chân Thực (Photorealistic)
DALL-E không gặp quá nhiều vấn đề về độ sâu trường ảnh, nhưng tôi nghĩ rằng nó khá tệ trong việc tạo ra hình ảnh chân thực. Ví dụ, tôi lần đầu tiên yêu cầu AI tạo ra một hình ảnh chú chó Golden Retriever trên núi (mà không nói rõ đó nên là loại ảnh nào).
Hình ảnh một chú chó Golden Retriever trong phong cảnh núi non được AI DALL-E tạo ra
Mặc dù khá đẹp, nhưng vẫn rõ ràng bức ảnh này được tạo ra bằng AI. Vì vậy, tôi đã yêu cầu DALL-E làm cho nó chân thực hơn. Ngược lại, hình ảnh lại trông giả hơn (và thành thật mà nói, hơi đáng sợ).
Thử nghiệm của DALL-E khi tạo ảnh chân thực về chú chó Golden Retriever nhưng kết quả không như mong đợi
Sử dụng Photorealistic Custom GPT có thể giúp ích, nhưng bạn cần có gói đăng ký cao cấp để truy cập tính năng này. Nếu không, tôi có thể đề xuất nhiều trình tạo ảnh AI khác tạo ra hình ảnh chân thực, trong đó Adobe Firefly là gợi ý hàng đầu của tôi.
4. Phần Mềm Không “Lắng Nghe” Yêu Cầu Loại Trừ Chi Tiết
Một cách để viết prompt hiệu quả hơn trong Midjourney, ChatGPT và các công cụ AI khác là nói rõ những gì bạn không muốn phần mềm thực hiện. Trong nhiều trường hợp, làm như vậy sẽ cho kết quả tốt hơn. Tuy nhiên, DALL-E lại là một ngoại lệ.
Trong nhiều lần, tôi đã nói với DALL-E không bao gồm một số yếu tố nhất định trong bức ảnh của tôi. Tuy nhiên, công cụ này vẫn thêm chúng vào. Đôi khi, việc tạo lại hình ảnh có hiệu quả, nhưng sẽ tốt hơn nếu không phải làm điều này. Ngược lại, tôi hiếm khi gặp vấn đề này khi sử dụng Adobe Firefly.
5. Sự Không Nhất Quán Trong Một Số Lĩnh Vực
Nhiều trình tạo ảnh AI đều có điểm yếu; ví dụ, khi tôi thử nghiệm Photo AI, nó đặc biệt tệ trong việc tạo ra bàn tay. DALL-E cũng mắc phải lỗi không nhất quán trong nhiều lĩnh vực khác nhau.
Mặc dù DALL-E rất tuyệt trong việc tạo ra các hình ảnh chung, nhưng nó không phải lúc nào cũng tốt trong việc tạo ra hình ảnh người đang cầm các vật thể. Kỳ lạ hơn, phần mềm này cũng kém trong việc tạo ra màn hình máy tính. Thông thường, nó sẽ cho bạn một cụm hình dạng ngẫu nhiên. Yêu cầu phần mềm tắt màn hình máy tính đôi khi (nhưng không phải luôn luôn) có thể giúp ích.
6. Phong Cách Hình Ảnh Không Đồng Nhất
DALL-E có thể tạo ra nhiều loại hình ảnh khác nhau; bạn có thể tạo ảnh AI trông như tranh vẽ, và cũng có thể tạo ra hình ảnh trông có vẻ 3D hơn. Tuy nhiên, sự đa dạng này trong việc tạo hình ảnh đôi khi có thể dẫn đến phong cách không nhất quán.
Khi yêu cầu DALL-E tạo ra một hình ảnh, bạn phải cụ thể về những gì bạn muốn. Nếu không, bạn có thể nhận được bất cứ thứ gì. Đây không phải là vấn đề nếu bạn chỉ đang thử nghiệm ứng dụng, nhưng lại là vấn đề lớn nếu bạn muốn một phong cách nhất quán trên toàn bộ các sản phẩm.
7. Kích Thước Vật Thể Không Chính Xác (Artifact Sizing)
Việc làm cho các vật thể trong hình ảnh của bạn trông cân đối với kích thước thực tế của chúng là rất quan trọng nếu bạn quan tâm đến độ chính xác của ảnh. Thật không may, DALL-E đôi khi không thể làm cho các vật thể trông đúng như chúng nên có. Ví dụ, nếu bạn yêu cầu phần mềm tạo hình ảnh một người đang cầm điện thoại trên tay, điện thoại đôi khi sẽ quá lớn.
Ban đầu, tôi nghĩ rằng việc yêu cầu phần mềm tạo ảnh góc rộng hơn sẽ giải quyết được vấn đề. Tuy nhiên, điều này thực sự làm mọi thứ tồi tệ hơn. Hơn nữa, người trong ảnh cuối cùng trông lại rất giả tạo. Thử các prompt chỉnh sửa DALL-E khác nhau có thể hiệu quả với bạn, nhưng tôi vẫn chưa tìm ra cách khắc phục cho vấn đề này.
Hình ảnh một người đang cầm điện thoại do DALL-E tạo ra, với kích thước điện thoại bị phóng đại
8. DALL-E Gặp Khó Khăn Khi Tạo Vật Liệu Bên Ngoài
Ban đầu, tôi nghĩ DALL-E sẽ là một cách tuyệt vời để tạo lịch cá nhân, thiệp sinh nhật, hình nền điện thoại và nhiều thứ khác. Tuy nhiên, tôi nhanh chóng phát hiện ra rằng phần mềm này không làm tốt ở lĩnh vực này.
Ví dụ, tôi đã thử làm bìa thiệp sinh nhật bằng DALL-E trong quá khứ. Tôi muốn tạo một hình ảnh trong ứng dụng và sau đó tải nó lên một dịch vụ như Moonpig. Thật không may, tôi liên tục nhận được một thiết kế bao gồm một tấm thiệp sinh nhật bên trong bức ảnh.
Lỗi thiết kế thiệp sinh nhật của DALL-E 3 khi tạo ra hình ảnh tấm thiệp bên trong bức ảnh
Nếu bạn thực sự muốn sử dụng DALL-E cho các loại thiết kế này, tôi khuyên bạn không nên nói rằng bạn sẽ sử dụng nó trên thiệp sinh nhật. Thay vào đó, hãy chỉ định những gì bạn muốn chương trình tạo ra. Sau đó, bạn có thể điều chỉnh kích thước sau. Cách tốt nhất có lẽ là chỉ tạo hình ảnh trong DALL-E và thêm văn bản trong một ứng dụng khác.
9. Tạo Ảnh Kém Chất Lượng Khi Yêu Cầu Nhiều Tùy Chọn
Đôi khi, tôi không biết chính xác thiết kế AI nào mình muốn sử dụng. Trong những trường hợp này, việc nhờ các trình tạo ảnh AI tạo ra nhiều biến thể hình ảnh có thể là hợp lý. Nhưng theo kinh nghiệm cá nhân, DALL-E thường khá “lười biếng” khi cung cấp nhiều tùy chọn cho tôi.
Trong nhiều trường hợp, các bức ảnh tôi nhận được thường trông rất giống nhau. Do đó, bạn phải cực kỳ cụ thể. Tôi cũng nhận thấy rằng việc tạo từng hình ảnh một có hiệu quả hơn là yêu cầu nhiều biến thể cùng lúc.
Mặc dù tôi rất thích sử dụng DALL-E nói chung, nhưng phần mềm này không hoàn hảo và bạn sẽ gặp phải các vấn đề khi sử dụng. Ví dụ, nó kém trong việc tạo ra hình ảnh chân thực nếu không có các Custom GPT. Hơn nữa, phần mềm thường không loại trừ các yếu tố mà tôi không mong muốn có trong ảnh. Tuy nhiên, tôi vẫn khuyên bạn nên thử DALL-E; hãy tự mình trải nghiệm để xem những vấn đề này có xảy ra với bạn hay không.