OpenAI đã công bố phiên bản thứ ba của nền tảng nghệ thuật thị giác AI tổng quát DALL-E, hiện cho phép người dùng sử dụng ChatGPT để tạo lời nhắc nhở và bao gồm nhiều tùy chọn an toàn hơn. 

DALL-E chuyển đổi lời nhắc nhở văn bản thành hình ảnh mà ngay cả DALL-E 2 cũng mắc lỗi, thường bỏ qua cách diễn đạt cụ thể. Các nhà nghiên cứu OpenAI cho biết phiên bản mới nhất hiểu ngữ cảnh tốt hơn nhiều.

Một tính năng mới của DALL-E 3 là tích hợp với ChatGPT. Bằng cách sử dụng ChatGPT, người dùng không cần phải đưa ra lời nhắc chi tiết của riêng mình để hướng dẫn DALL-E 3. Mà họ chỉ cần yêu cầu ChatGPT đưa ra lời nhắc và chatbot sẽ viết ra một đoạn văn (DALL-E hoạt động tốt hơn với các câu dài hơn) để DALL-E 3 làm theo. Những người dùng khác vẫn có thể sử dụng lời nhắc của riêng họ nếu họ có ý tưởng cụ thể về DALL-E. 

Trong bản demo của The Verge, Aditya Ramesh, nhà nghiên cứu chính và người đứng đầu nhóm DALL-E, đã đề nghị ChatGPT giúp anh ấy nghĩ ra logo cho một nhà hàng ramen trên núi. ChatGPT sau đó đã viết một lời nhắc dài hơn và DALL-E đưa ra bốn tùy chọn. Đề xuất của DALL-E 3 là hình ảnh một ngọn núi với mì ramen phủ tuyết, nước dùng chảy xuống như thác nước và trứng muối trên mặt đất như những viên đá trong vườn – mặc dù nó trông giống một hình minh họa cho một món hàng đẹp nào đó hơn là một logo nhà hàng thông thường. OpenAI cho biết, kết nối này với chatbot cho phép nhiều người tạo ra tác phẩm nghệ thuật AI vì họ không cần phải giỏi đưa ra lời nhắc.

DALL-E
DALL·E 3: Trình tạo hình ảnh AI dành cho nhà thiết kế sản phẩm

DALL-E, được phát hành lần đầu tiên vào tháng 01 năm 2021, xuất hiện trước các nền tảng nghệ thuật AI tạo văn bản thành hình ảnh khác của Stability AI và Midjourney. Vào thời điểm DALL-E 2 được phát hành vào năm 2022, OpenAI đã mở một danh sách chờ để kiểm soát ai có quyền sử dụng nền tảng này sau những lời chỉ trích rằng DALL-E có thể tạo ra hình ảnh rõ ràng như ảnh chân thực và thể hiện sự thiên vị khi tạo ảnh. Công ty đã xóa danh sách chờ vào tháng 9 năm ngoái và mở DALL-E 2 ra công chúng.

Phiên bản DALL-E mới này sẽ được phát hành lần đầu tiên cho người dùng ChatGPT Plus và ChatGPT Enterprise vào tháng 10, sau đó là các phòng thí nghiệm nghiên cứu và dịch vụ API của nó vào mùa thu. OpenAI có kế hoạch trì hoãn việc phát hành DALL-E 3 nhưng không chắc chắn khi nào phiên bản công khai miễn phí sẽ được phát hành.

OpenAI tuyên bố họ tập trung rất nhiều công việc vào DALL-E 3 trong việc tạo ra các biện pháp an toàn mạnh mẽ để ngăn chặn việc tạo ra các hình ảnh dâm dục hoặc có khả năng gây thù hận. OpenAI cho biết họ đã làm việc với các nhóm đỏ bên ngoài – một nhóm cố tình phá vỡ hệ thống để kiểm tra độ an toàn của nó – và dựa vào các bộ phân loại đầu vào, một cách dạy các mô hình ngôn ngữ bỏ qua một số từ nhất định để tránh những lời nhắc rõ ràng hoặc bạo lực. DALL-E 3 cũng sẽ không thể tạo lại hình ảnh của các nhân vật của công chúng – miễn là lời nhắc đề cập cụ thể đến một cái tên. 

Sandhini Agarwal, một nhà nghiên cứu chính sách của công ty, cho biết cô “rất tin tưởng” vào các biện pháp an toàn của mình nhưng cũng nói rõ rằng mô hình này liên tục được cải tiến và không hoàn hảo. Đại diện OpenAI cho biết trong email rằng DALL-E 3 đã được đào tạo để từ chối tạo ra những hình ảnh theo phong cách nghệ sĩ sống. Không giống như DALL-E 2, khi được nhắc, có thể bắt chước nghệ thuật theo phong cách của một số nghệ sĩ nhất định.

penAI, có thể để tránh các vụ kiện, cũng sẽ cho phép các nghệ sĩ loại tác phẩm của họ ra khỏi các phiên bản tương lai của mô hình AI chuyển văn bản thành hình ảnh. Người sáng tạo có thể gửi hình ảnh mà họ sở hữu quyền và yêu cầu xóa hình ảnh đó theo biểu mẫu trên trang web của mình. Sau đó, phiên bản tương lai của DALL-E có thể chặn các kết quả trông giống với hình ảnh và phong cách của nghệ sĩ. Các nghệ sĩ đã kiện các đối thủ cạnh tranh của DALL-E Stability AI và Midjourney, cùng với trang web nghệ thuật DeviantArt, vì bị cáo buộc sử dụng tác phẩm có bản quyền của họ để đào tạo các mô hình chuyển văn bản thành hình ảnh của họ. 

 

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *