- Một ngày sau khi OpenAI gây ấn tượng với mô hình ChatGPT AI được cải tiến đáng kinh ngạc, Google đã trình diễn một tầm nhìn ấn tượng không kém về cách trí tuệ nhân tạo (AI) sẽ cải thiện các sản phẩm mà hàng tỷ người đang sử dụng hàng ngày.
Các bản cập nhật, được công bố tại hội nghị nhà phát triển Google I/O hàng năm, được đưa ra khi công ty đang cố gắng vượt ra ngoài hoạt động kinh doanh quảng cáo cốt lõi của mình bằng các thiết bị mới và công cụ hỗ trợ AI. Trí tuệ nhân tạo được nhắc đến hàng đầu trong sự kiện này, Giám đốc điều hành Google Sundar Pichai cho biết ở cuối bài thuyết trình. Trong bài thuyết trình này, thuật ngữ “AI” đã được nhắc đến 120 lần và đây là con số do nền tảng Ai Gemini của Google đếm được.
Trong bài phát biểu quan trọng của CEO Sundar Pichai, Google đã cho thấy họ muốn các sản phẩm AI của mình trở thành một phần quan trọng hơn trong cuộc sống của người dùng như bằng cách chia sẻ thông tin, tương tác với người khác, tìm kiếm đồ vật xung quanh nhà, lập lịch trình, mua sắm và sử dụng thiết bị Android. Về cơ bản, Google muốn AI của mình trở thành một phần trong mọi việc bạn làm.
CEO Pichai đã bắt đầu sự kiện bằng cách nêu bật nhiều tính năng mới khác nhau được hỗ trợ bởi mô hình AI mới nhất - Gemini 1.5 Pro. Một tính năng mới, được gọi là Ask Photos, cho phép người dùng tìm kiếm ảnh để có thông tin chi tiết sâu hơn, chẳng hạn như hỏi khi nào con gái bạn học bơi hoặc nhớ lại biển số xe của bạn là gì, bằng cách xem qua các ảnh đã lưu.
Ông Pichai cũng chỉ ra cách người dùng có thể yêu cầu Gemini 1.5 Pro tóm tắt tất cả các email gần đây từ trường học của con bạn bằng cách phân tích các tệp đính kèm, tóm tắt các điểm chính và đưa ra các mục hành động.
Trong khi đó, các giám đốc điều hành của Google lần lượt thể hiện các khả năng khác, chẳng hạn như cách mô hình mới nhất có thể “đọc” sách giáo khoa và biến nó thành một loại bài giảng AI với các giáo viên có giọng nói tự nhiên và có thể trả lời các câu hỏi.
Chỉ một ngày trước đó, OpenAI - một trong những công ty hàng đầu trong ngành công nghệ về trí tuệ nhân tạo - đã tiết lộ một mô hình AI mới mà hãng cho biết sẽ giúp chatbot ChatGPT thông minh hơn và dễ sử dụng hơn. GPT-4o nhằm mục đích biến ChatGPT thành trợ lý cá nhân kỹ thuật số có thể tham gia vào các cuộc trò chuyện bằng giọng nói trong thời gian thực và tương tác bằng cách sử dụng văn bản và “khả năng nhìn”. Nó có thể xem ảnh chụp màn hình, ảnh, tài liệu hoặc biểu đồ do người dùng tải lên và trò chuyện về chúng.
Google cũng cho thấy những khả năng mới nhất của Gemini trong việc sử dụng các loại thông tin đầu vào khác nhau - khả năng "đa phương thức" để tiếp nhận văn bản, giọng nói hoặc hình ảnh - như một phản hồi trực tiếp cho những nỗ lực của ChatGPT. Một giám đốc điều hành của Google cũng đã giới thiệu một “đồng đội” ảo có thể giúp luôn cập nhật danh sách việc cần làm, sắp xếp dữ liệu và quản lý quy trình làm việc.
Công ty cũng nêu bật những cải tiến về công cụ tìm kiếm bằng cách cho phép người dùng đặt những câu hỏi tự nhiên hơn hoặc tập trung hơn, đồng thời cung cấp nhiều phiên bản phản hồi khác nhau, chẳng hạn như kết quả chuyên sâu hoặc tóm tắt. Nó cũng có thể đưa ra các đề xuất có mục tiêu, chẳng hạn như đề xuất các nhà hàng thân thiện với trẻ em ở một số địa điểm nhất định hoặc lưu ý những gì có thể xảy ra với một thiết bị, chẳng hạn như máy ảnh, bằng cách quay video về sự cố qua Google Lens. Công ty cho biết mục tiêu là loại bỏ phần công việc nhàm chán, phải tìm kiếm đi đi lại lại trên Google.
Công ty cũng giới thiệu ngắn gọn về Dự án Astra, được phát triển bởi phòng thí nghiệm AI DeepMind của Google, sẽ cho phép trợ lý AI hỗ trợ cuộc sống hàng ngày của người dùng bằng cách sử dụng camera điện thoại để diễn giải thông tin về thế giới thực, chẳng hạn như xác định đồ vật và thậm chí tìm kiếm các đồ vật bị thất lạc. Nó cũng gợi ý về cách nó sẽ hoạt động trên kính thực tế tăng cường.
Google cho biết cuối năm nay hãng sẽ tích hợp thêm nhiều chức năng AI vào điện thoại. Ví dụ: người dùng sẽ có thể kéo và thả hình ảnh do AI tạo vào Google Messages và Gmail và đặt câu hỏi về video YouTube và tệp PDF trên thiết bị Android.
Và trong một động thái có thể sẽ thu hút nhiều người, một công cụ tích hợp mới dành cho Android sẽ giúp phát hiện hoạt động đáng ngờ giữa cuộc gọi, chẳng hạn như kẻ lừa đảo đang cố gắng bắt chước ngân hàng của người dùng.
Theo nhà phân tích Jacob Bourne, từ công ty nghiên cứu thị trường Emarketer, không có gì ngạc nhiên khi AI chiếm vị trí trung tâm tại hội nghị nhà phát triển Google năm nay.
Ông Bourne nói: “Bằng cách trình làng các mẫu mới nhất của mình và cách chúng hỗ trợ các sản phẩm hiện có với khả năng tiếp cận người tiêu dùng mạnh mẽ, Google đang chứng minh cách họ có thể tạo sự khác biệt một cách hiệu quả so với các đối thủ”.
Nhà phân tích Jacob Bourne tin rằng việc tiếp nhận các công cụ mới sẽ là một dấu hiệu cho thấy Google có thể điều chỉnh sản phẩm tìm kiếm của mình tốt đến mức nào để đáp ứng nhu cầu của kỷ nguyên AI tạo sinh.
“Để duy trì lợi thế cạnh tranh và làm hài lòng các nhà đầu tư, Google sẽ cần tập trung vào việc đưa những cải tiến AI của mình thành các sản phẩm và dịch vụ có lợi nhuận trên quy mô lớn”, ông Bourne nói thêm.
Khi Google tìm cách mở rộng dấu ấn AI của mình, họ cho biết họ sẽ đưa ra nhiều biện pháp bảo vệ hơn để giảm thiểu khả năng AI bị lạm dụng. Google đang mở rộng tính năng SynthID hiện có để phát hiện nội dung do AI tạo ra. Năm ngoái, công cụ này đã thêm ký tự đóng dấu mờ vào hình ảnh và âm thanh do AI tạo ra.
Google cho biết họ cũng đang hợp tác với các chuyên gia và tổ chức để thử nghiệm và cải thiện khả năng trong các mô hình mới của mình.
Mặc dù công ty đã tăng gấp đôi số lượng trí tuệ nhân tạo trong năm qua nhưng nó cũng gặp phải những rào cản đáng kể. Năm ngoái, ngay sau khi giới thiệu công cụ AI tạo sinh của mình - khi đó được gọi là Bard và sau đó được đổi tên thành Gemini - giá cổ phiếu của Google đã giảm sau khi một video demo về công cụ này cho thấy nó đưa ra phản hồi thực tế không chính xác cho câu hỏi về Kính viễn vọng Không gian James Webb.
Gần đây hơn, vào tháng 2, công ty đã tạm dừng khả năng tạo ra hình ảnh con người của Gemini sau khi công ty này bị chỉ trích trên mạng xã hội vì tạo ra những hình ảnh không chính xác về mặt lịch sử.
Gemini, giống như các công cụ AI khác như ChatGPT, được đào tạo dựa trên kho dữ liệu trực tuyến khổng lồ. Các chuyên gia từ lâu đã cảnh báo về những thiếu sót xung quanh các công cụ AI, chẳng hạn như khả năng thiếu chính xác, sai lệch và lan truyền thông tin sai lệch. Tuy nhiên, nhiều công ty vẫn đang phát triển các công cụ AI hoặc thiết lập các quan hệ đối tác AI.
Apple có thể quan tâm đến việc cấp phép và xây dựng công cụ AI Gemini của Google, bao gồm chatbot và các công cụ AI khác, cho những chiếc iPhone sắp ra mắt và các tính năng iOS 18 của nó, Bloomberg đưa tin vào tháng 3. Công ty cũng được cho là đang đàm phán với OpenAI – công ty tạo ra ChatGPT.