Apple tạo ra công cụ hình ảnh AI cho phép chỉnh sửa ảnh bằng cách mô tả

0
0

 - Các nhà nghiên cứu của Apple đã cho ra mắt một mô hình mới cho phép người dùng miêu tả bằng ngôn ngữ đơn giản những gì họ muốn thay đổi trong ảnh mà không cần chạm vào phần mềm chỉnh sửa ảnh.

 

Mô hình MGIE là kết quả của sự hợp tác giữa Apple và các nhà nghiên cứu từ Đại học California, Santa Barbara. Mô hình này có thể cắt, thay đổi kích thước, lật và thêm bộ lọc vào hình ảnh thông qua lời nhắc văn bản.

MGIE, viết tắt của Chỉnh sửa hình ảnh có hướng dẫn MLLM, có thể được áp dụng cho các tác vụ chỉnh sửa hình ảnh đơn giản và phức tạp hơn như sửa đổi các đối tượng cụ thể trong ảnh để làm cho chúng có hình dạng khác hoặc sáng hơn. Mô hình này kết hợp hai cách sử dụng khác nhau của các mô hình ngôn ngữ đa phương thức. Đầu tiên, nó học cách diễn giải lời nhắc của người dùng. Sau đó, nó "tưởng tượng" nội dung chỉnh sửa sẽ trông như thế nào (ví dụ: yêu cầu bầu trời xanh hơn trong ảnh sẽ làm tăng độ sáng trên phần bầu trời của ảnh).

Khi chỉnh sửa ảnh bằng MGIE, người dùng chỉ cần gõ những gì họ muốn thay đổi về bức ảnh. Bài viết đã sử dụng ví dụ về chỉnh sửa hình ảnh một chiếc bánh pizza pepperoni. Nhập lời nhắc “làm cho nó trông tốt cho sức khỏe hơn hơn”, nó sẽ được thêm rau củ phủ lên trên. Bức ảnh chụp những con hổ ở sa mạc Sahara có vẻ tối nhưng sau khi yêu cầu mô hình làm tăng “thêm độ tương phản để mô phỏng nhiều ánh sáng hơn”, bức ảnh có vẻ sáng hơn.

“Thay vì hướng dẫn ngắn gọn nhưng mơ hồ, MGIE đưa ra ý định nhận thức trực quan rõ ràng và dẫn đến việc chỉnh sửa hình ảnh hợp lý. Chúng tôi tiến hành nghiên cứu sâu rộng từ nhiều khía cạnh chỉnh sửa khác nhau và chứng minh rằng MGIE của chúng tôi cải thiện hiệu suất một cách hiệu quả trong khi vẫn duy trì hiệu quả cạnh tranh. Chúng tôi cũng tin rằng khuôn khổ hướng dẫn MLLM có thể đóng góp cho nghiên cứu ngôn ngữ và tầm nhìn trong tương lai”, các nhà nghiên cứu cho biết trong bài báo.

Apple đã cung cấp MGIE thông qua GitHub để tải xuống, nhưng họ cũng phát hành bản demo web trên Hugging Face Spaces.

Một số nền tảng tạo hình ảnh, như DALL-E 3 của OpenAI, có thể thực hiện các tác vụ chỉnh sửa ảnh đơn giản trên ảnh mà chúng tạo thông qua nhập văn bản. Adobe, nhà sáng tạo Photoshop, phần mềm mà hầu hết mọi người tìm đến để chỉnh sửa hình ảnh, cũng có mô hình chỉnh sửa AI của riêng mình. Mô hình Firefly AI của nó hỗ trợ tính năng tạo màu tổng quát, giúp thêm hình nền được tạo cho ảnh.

Apple chưa phải là ông lớn trong lĩnh vực AI tạo sinh, không giống như Microsoft, Meta hay Google, nhưng CEO Tim Cook của Apple cho biết công ty muốn bổ sung thêm nhiều tính năng AI hơn cho các thiết bị của mình trong năm nay. Vào tháng 12, các nhà nghiên cứu của Apple đã phát hành một khung máy học nguồn mở có tên MLX để giúp đào tạo các mô hình AI trên chip Apple Silicon dễ dàng hơn.

Kiệt Linh

Ý kiến bạn đọc


Lời cảm ơn của gia đình Tổng Bí thư Nguyễn Phú Trọng

Chiều 26/7, ông Nguyễn Trọng Trường, đại diện gia đình Tổng Bí thư Nguyễn Phú Trọng đọc Lời cảm ơn của gia đình Tổng Bí thư tại Lễ Truy điệu.

Bức tâm thư của Phu nhân Tổng Bí thư Lào gửi Phu nhân Tổng Bí thư

(VnMedia) - VnMedia xin đăng tải toàn văn bức tâm thư của Phu nhân Tổng Bí thư Lào Naly Sisoulith gửi Phu nhân Tổng Bí thư Nguyễn Phú Trọng, Ngô Thị Mận.

Nhớ về một người Cộng sản chân chính

(VnMedia)- Mỗi khi nghĩ về Tổng Bí thư Nguyễn Phú Trọng là trong tôi hiện lên hình ảnh một người Cộng sản chân chính. Và, lúc này, tôi lại nhớ đến câu chuyện mẹ tôi vẫn kể trong những năm tháng bà còn sống về cha tôi - một người Cộng sản...

Cảnh báo chiêu trò lừa đảo tuyển người mẫu, cầu thủ nhí trên không gian mạng

(VnMedia) - Bộ Công an vừa phát đi cảnh báo về chiêu trò lừa đảo tuyển mẫu nhí, cầu thủ nhí, người đại diện thương hiệu nhằm chiếm đoạt tài sản qua không gian mạng.

Giá vàng đảo chiều tăng mạnh

(VnMedia) - Chốt phiên giao dịch rạng sáng nay (24/7), giá vàng giao ngay tại thị trường New York đã đảo chiều tăng mạnh hơn 13 USD/ounce. Trong nước, chiều qua, giá vàng miếng SJC vẫn duy trì ở mốc gần 80 triệu đồng/lượng ở chiều bán ra.