- Google đang hướng tới tương lai với tất cả các thông báo về các công cụ phần mêm liên quan đến trí tuệ nhân tạo (AI) tại Hội nghị dành cho các nhà phát triển Google I/O diễn ra vào ngày hôm qua 14/5. Nhưng những cải tiến trong ứng dụng AI Gemini không phải là điều thú vị duy nhất mà Google công bố. Vì cùng với đó, công ty còn giới thiệu Veo và Imagen 3, các công cụ AI tổng hợp nhằm hiện thực hóa tầm nhìn sáng tạo của người dùng.
Veo: Mô hình tạo video thế hệ tiếp theo
Veo có thể tạo video 1080p theo nhiều phong cách điện ảnh và hình ảnh cũng như những video đó có thể dài hơn một phút. Google cho biết video được tạo phải thể hiện chặt chẽ tầm nhìn sáng tạo của người dùng bằng cách nắm bắt chính xác âm điệu của lời nhắc và hiển thị chi tiết trong các lời nhắc dài hơn.
Mô hình này hiểu các thuật ngữ như tua nhanh thời gian hoặc ảnh chụp phong cảnh từ trên không. Video mà AI tạo ra phải mạch lạc, nhất quán và các chủ thể chuyển động một cách chân thực trong suốt các khung hình.
Để cải tiến hơn nữa mô hình, Google đã hợp tác với nhà làm phim Donald Glover và đang mời nhiều nhà làm phim cũng như các nhà sáng tạo khác thử nghiệm Veo.
Veo có sẵn cho một số người sáng tạo được chọn ở chế độ xem trước riêng tư trong VideoFX bằng cách tham gia danh sách chờ. Google có kế hoạch đưa Veo vào YouTube Shorts trong tương lai.
Imagen 3: Mô hình chuyển văn bản thành hình ảnh của Google được cải thiện
Google đã nỗ lực nâng cao chất lượng mô hình tạo hình ảnh của mình. Imagen 3 tạo ra hình ảnh chân thực, sống động như thật và không có nhiều hiện tượng giả khi so sánh với các mẫu trước đó.
Trên thực tế, những hình ảnh do Imagen 3 tạo ra khá bất ngờ. Dưới đây là một số ví dụ được chia sẻ bởi Google.
Đối với hình ảnh đầu tiên, cận cảnh một con sói bóng mượt ngồi uy nghiêm trước nền xám, trong một bức ảnh có độ phân giải cao với các chi tiết đẹp mắt, tách biệt trên một bức ảnh stock đơn giản với khả năng phân loại màu theo phong cách siêu thực.
Hình ảnh thứ hai, nhìn từ trên cao hẻm núi sông tuyệt đẹp với cây cối, thể hiện vẻ đẹp thiên nhiên với những ngọn núi xanh và làn nước trong xanh. Bức ảnh ghi lại sự rộng lớn của tạo hóa thiên nhiên theo phong cách tạo hóa của nó.
Hình ảnh thứ ba, ba người phụ nữ đứng cùng nhau cười, trong đó có một người phụ nữ hơi mất nét ở phía trước. Mặt trời đang lặn phía sau những người phụ nữ, tạo ra ánh sáng lóa của ống kính và ánh sáng ấm áp làm nổi bật mái tóc của họ và tạo ra hiệu ứng mờ ảo ở hậu cảnh. Phong cách chụp ảnh chân thực và ghi lại khoảnh khắc chân thực của sự kết nối và hạnh phúc giữa những người bạn. Ánh sáng ấm áp của giờ vàng mang lại cảm giác hoài cổ và thân mật cho hình ảnh.
Imagen 3 thậm chí có thể vẽ. Bản vẽ này trông hoàn toàn tuyệt vời (trông nó không giống do AI tạo ra). Những đường nét biểu cảm mờ và ghi lại chuyển động năng động của một vũ công trong bức vẽ bằng than có cử chỉ. Phác thảo trên giấy da cũ.
Giống như Veo, Imagen 3 có sẵn để chọn những người thử nghiệm đáng tin cậy bằng cách tham gia danh sách chờ.
Music AI Sandbox: Nhạc sĩ không bị bỏ rơi
Google đang hợp tác với các nhạc sĩ, nhạc sĩ và nhà sản xuất để phát triển các công nghệ âm nhạc tổng hợp, bao gồm Lyria, mô hình tiên tiến nhất của Google để tạo nhạc AI. Google đang nghiên cứu một bộ công cụ AI về âm nhạc như Music AI Sandbox. Điều này sẽ cho phép mọi người tạo các phần nhạc cụ từ đầu hoặc biến đổi âm thanh.
Hải Linh