- Gemini trên thiết bị Android sẽ nhận được rất nhiều bản cập nhật trong những tháng tới và một trong những trải nghiệm mới được giới thiệu tại Hội nghị Google I/O hôm qua là "Gemini Live". Hình thức trực tiếp (Live) là một cách mới để nói chuyện với tính năng trí tuệ nhân tạo (AI) trên điện thoại, sử dụng công nghệ giọng nói chuyên dụng để làm cho việc nói chuyện với AI có vẻ tự nhiên và dễ dàng.
Gemini là ứng dụng trí tuệ nhân tạo được Google đề cập lần đầu tiên tại hội nghị nhà phát triển Google I/O được diễn ra vào thời điểm tháng 5/2023. Vào thời điểm đó, Giám đốc điều hành Sundar Pichai đã hé lộ thông tin về hệ thống trí tuệ nhân tạo (AI) sắp ra mắt, cạnh tranh với ChatGPT của OpenAI lúc bấy giờ.
Google Gemini được xây dựng là một mô hình ngôn ngữ lớn (LLM), dựa trên nền tảng dữ liệu khổng lồ đến từ Google. Công cụ này có chức năng tạo văn bản bằng ngôn ngữ, sáng tạo đa dạng các loại nội dung và đáp ứng nhu cầu truy vấn của người dùng về hầu hết như là mọi lĩnh vực.
Đánh giá sơ bộ của giới công nghệ, Gemini có sức mạnh gấp 5 lần so với GPT-4, tạo ra câu trả lời chính xác hơn, đầy đủ hơn, suy luận sâu hơn. Từ đó cải thiện trải nghiệm công nghệ tối ưu hơn cho người dùng.
Sau tròn một năm kể từ lần giới thiệu đầu tiên, Gemini đã được nhóm các kỹ sư của Google tích hợp thêm các tính năng mới.
Trong buổi giới thiệu trực tiếp tại hội nghị Google I/O, mọi người đã được xem cuộc trò chuyện giữa Chuyên gia sản phẩm Google và Gemini Live. Một câu nói và câu hỏi đơn giản như "Tôi sắp được phỏng vấn xin việc làm nhân viên pha chế, nhưng tôi chưa từng làm nhân viên pha chế trước đây. Bạn có thể cho tôi một số gợi ý được không?" và Gemini ngay lập tức bắt tay vào việc đưa ra những gợi ý về cách chuẩn bị sẵn sàng cho cuộc phỏng vấn xin việc này. Các đề xuất bao gồm những việc như xem video về cách pha một số đồ uống đơn giản và thực hành cách pha chúng ở nhà trước, điều này rất có ý nghĩa. Cuộc trò chuyện có vẻ tự nhiên, gần giống như bạn đang nói chuyện với một người khác.
Điều ấn tượng nhất là việc nhân viên Google ngắt lời Gemini giữa câu, thêm hoặc thay đổi nội dung câu hỏi, giống như bạn làm với một người khác. Gemini phản ứng với những gián đoạn này như một người nhanh nhạy và điều chỉnh các đề xuất theo cuộc trò chuyện sao cho phù hợp. Những người theo dõi tình huống này khá ấn tượng với một nhóm nhỏ các kỹ thuật viên và xem những gì họ đang triển khai ngày càng gây ấn tượng mạnh hơn.
Tuy nhiên, bản demo đã tạm dừng khi thiết bị Pixel được sử dụng đột nhiên mất kết nối với Wi-Fi và Gemini ngừng phản hồi. Thật thú vị khi xem cách người trình bày phục hồi sau sự cố kỹ thuật này, nhưng có một vấn đề đặt ra là liệu tính năng này chỉ chạy trên thiết bị hay không. Câu trả lời là "Không" rõ ràng. Gemini Live có thành phần đám mây cần kết nối Internet để hoạt động, giống như Gemini trên Android ngày nay.
Các khả năng vẫn rất đáng chú ý và nếu điều gì đó như mất kết nối Internet làm gián đoạn luồng trao đổi của bạn với Gemini, bạn vẫn có thể tiếp tục câu chuyện ở thời điểm bị ngắt quãng nhờ Gemini lưu giữ lịch sử chi tiết về các cuộc trò chuyện của họ với bạn. Tất nhiên, đó có thể là điểm khó khăn đối với những người dùng quan tâm đến quyền riêng tư. Nhưng một lần nữa, Gemini Live là một trải nghiệm tùy chọn dự kiến sẽ sớm được triển khai cho những người đăng ký Gemini Advanced và đây chắc chắn là một tính năng đáng mong đợi.
Hải Linh