OpenAI trình làng mô hình AI mới nhất - GPT-4o, quyết giành chiến thắng trong cuộc đua AI

0
0

 - ChatGPT sắp sửa sẽ trở nên hữu ích hơn rất nhiều. OpenAI hôm qua (13/5) đã công bố mô hình ngôn ngữ lớn trí tuệ nhân tạo mới nhất mà họ cho biết sẽ giúp ChatGPT thông minh hơn và dễ sử dụng hơn. Mô hình mới được đưa ra khi OpenAI tìm cách đi trước các đối thủ trong cuộc cạnh tranh ngày càng khốc liệt trong cuộc chạy đua AI.

 

Mô hình mới, được gọi là GPT-4o, là bản cập nhật từ mô hình GPT-4 trước đó của công ty. GPT-4 được cho ra mắt chỉ hơn một năm trước. Mô hình này sẽ có sẵn cho khách hàng chưa trả phí, đồng nghĩa với việc là bất kỳ ai cũng sẽ có quyền truy cập vào công nghệ tiên tiến nhất của OpenAI thông qua ChatGPT.

Dựa trên những gì được đưa ra thể hiện ngày hôm qua (13/5) của công ty OpenAI, GPT-4o sẽ biến ChatGPT thành một trợ lý cá nhân kỹ thuật số có thể tham gia vào các cuộc trò chuyện bằng giọng nói theo thời gian thực một cách hiệu quả. Nó cũng sẽ có thể tương tác bằng cách sử dụng văn bản và “khả năng nhìn”, nghĩa là nó có thể xem ảnh chụp màn hình, ảnh, tài liệu hoặc biểu đồ do người dùng tải lên và trò chuyện về chúng.

Giám đốc phụ trách công nghệ của OpenAI Mira Murati cho biết, phiên bản cập nhật của ChatGPT giờ đây cũng sẽ có khả năng ghi nhớ, nghĩa là nó có thể học hỏi từ các cuộc trò chuyện trước đó với người dùng và có thể dịch thuật theo thời gian thực.

Bà Murati cho biết trong buổi giới thiệu bản demo trực tiếp từ trụ sở chính của công ty ở San Francisco rằng: “Đây là lần đầu tiên chúng tôi thực sự đạt được một bước tiến lớn về tính dễ sử dụng. Sự tương tác này trở nên tự nhiên hơn và dễ dàng hơn rất nhiều.”

Bản phát hành mới được đưa ra khi OpenAI tìm cách giữ vững vị trí dẫn đầu trong cuộc cạnh tranh ngày càng khốc liệt trong cuộc chạy đua AI. Các đối thủ của OpenAI bao gồm Google và Meta – hai gã khổng lồ công nghệ đang nỗ lực xây dựng các mô hình ngôn ngữ lớn ngày càng mạnh mẽ để hỗ trợ chatbot và có thể được sử dụng để đưa công nghệ AI vào nhiều sản phẩm khác.

Sự kiện OpenAI trình làng mô hình AI mới diễn ra một ngày trước hội nghị nhà phát triển I/O hàng năm của Google, tại đó hãng dự kiến ​​sẽ công bố các bản cập nhật cho mô hình Gemini AI của mình. Giống như GPT-4o mới, Gemini của Google cũng đa phương thức, nghĩa là nó có thể diễn giải và tạo văn bản, hình ảnh và âm thanh. Bản cập nhật của OpenAI cũng đi trước các thông báo về AI dự kiến ​​​​từ Apple tại Hội nghị các nhà phát triển toàn cầu vào tháng tới, có thể bao gồm những cách mới để kết hợp AI vào các phiên bản iPhone hoặc iOS tiếp theo.

Trong khi đó, bản phát hành GPT mới nhất có thể mang lại lợi ích cho Microsoft, hãng đã đầu tư hàng tỷ đô la vào OpenAI để nhúng công nghệ AI của mình vào các sản phẩm của chính Microsoft.

Các giám đốc điều hành của OpenAI đã minh họa cuộc trò chuyện bằng giọng nói với ChatGPT để nhận được hướng dẫn theo thời gian thực về cách giải một bài toán, cách kể chuyện trước khi đi ngủ và nhận lời khuyên về mã hóa. ChatGPT có thể nói bằng giọng tự nhiên, giống giọng con người cũng như giọng robot - và thậm chí còn hát một phần của một câu trả lời. Công cụ này cũng có thể xem hình ảnh của biểu đồ và thảo luận về nó.

Họ cũng cho thấy mô hình phát hiện cảm xúc của người dùng; trong một trường hợp, nó lắng nghe nhịp thở của một giám đốc điều hành và khuyến khích anh ta bình tĩnh lại.

“Bạn không phải là một cái máy hút bụi!”, giọng nữ của ChatGPT (nghe khá giống với người bạn đồng hành kỹ thuật số do Scarlett Johansson lồng tiếng trong bộ phim “Her” năm 2013) nói đùa với nhân viên.

ChatGPT cũng có thể trò chuyện bằng nhiều ngôn ngữ bằng cách dịch và phản hồi tự động. Theo OpenAI, công cụ này hiện hỗ trợ hơn 50 ngôn ngữ.

“Chế độ thoại (và video) mới là giao diện máy tính tốt nhất mà tôi từng sử dụng,” Giám đốc điều hành OpenAI Sam Altman cho biết trong một bài đăng trên blog sau sự kiện ra mắt mô hình AI mới. “Cảm giác giống như AI trong phim; và tôi vẫn hơi ngạc nhiên rằng nó là sự thật. Đạt được thời gian phản hồi và khả năng biểu đạt ở cấp độ con người hóa ra lại là một sự thay đổi lớn.”

Bà Murati cho biết OpenAI sẽ ra mắt ứng dụng máy tính để bàn ChatGPT với khả năng GPT-4o, mang đến cho người dùng một nền tảng khác để tương tác với công nghệ của công ty. GPT-4o cũng sẽ có sẵn cho các nhà phát triển muốn xây dựng chatbot tùy chỉnh của riêng họ từ cửa hàng GPT của OpenAI, một tính năng hiện cũng có sẵn cho người dùng không phải trả tiền.

Công nghệ và tính năng cập nhật sẽ được triển khai cho ChatGPT trong những tháng tới. Người dùng ChatGPT miễn phí sẽ có số lượng tương tác hạn chế với mô hình GPT-4o mới trước khi công cụ này tự động quay lại dựa trên mô hình GPT-3.5 cũ; người dùng trả phí sẽ có quyền truy cập vào số lượng tin nhắn lớn hơn với mẫu mới nhất.

OpenAI cho biết hơn 100 triệu người đã sử dụng ChatGPT. Tuy nhiên, trải nghiệm ChatGPT được cập nhật — và khả năng tương tác với nó trên máy tính để bàn và thông qua các cuộc trò chuyện bằng giọng nói được cải thiện — có thể khiến nhiều người có lý do hơn để sử dụng công nghệ của nó. Động thái này diễn ra vào thời điểm khi việc tích hợp AI vào các sản phẩm tiêu dùng được sử dụng rộng rãi hơn bởi Google và Meta, như Instagram và Google Assistant, có thể giúp công nghệ của các công ty đó được tiếp cận rộng rãi và dễ dàng hơn.

 

Kiệt Linh

Ý kiến bạn đọc


5 thị trường xuất khẩu chục tỷ USD của Việt Nam

(VnMedia) - Xuất khẩu hàng hóa của Việt Nam 5 tháng đầu năm 2024 sang Hoa Kỳ  có mức tăng mạnh nhất với 8,11 tỷ USD; tiếp theo là EU (27 nước) tăng 2,51 tỷ USD; Trung Quốc tăng 2,19 tỷ USD; ASEAN tăng 1,52 tỷ USD USD…

Người phụ nữ Hà Nội bị lừa gần 800 triệu đồng vì đầu tư "sàn tài chính online"

(VnMedia) - Thời gian qua, Công an Thành phố Hà Nội đã liên tục cảnh báo thủ đoạn lừa đảo khi tham gia đầu tư các sàn giao dịch tài chính online. Với lời quảng cáo đầu tư sinh lời, lãi xuất cao đánh vào tâm lý nhiều nhà đầu tư muốn kiếm tiền nhanh chóng...

Phát hiện lỗ hổng RCE nghiêm trọng trong Công cụ cơ sở hạ tầng AI của Ollama

(VnMedia) - Các nhà nghiên cứu bảo mật đã tiết lộ chi tiết về một lỗ hổng bảo mật hiện đã được vá ảnh hưởng đến nền tảng cơ sở hạ tầng trí tuệ nhân tạo (AI) nguồn mở Ollama có thể bị khai thác để thực thi mã từ xa (RCE).

Giá vàng liên tục trồi sụt, vàng nhẫn vẫn giữ mức cao

(VnMedia) - Chốt phiên giao dịch rạng sáng nay (26/6), giá vàng giao ngay tại thị trường New York đã đảo chiều giảm gần 12 USD/ounce. Trong nước, chiều qua, giá vàng nhẫn tròn trơn của Bảo Tín Minh Châu vẫn duy trì ở mức gần 76 triệu đồng/lượng.

Định danh và xác thực điện tử: Những quy định ai cũng cần biết

(VnMedia) - Nghị định 69/2024/NĐ-CP quy định về trình tự, thủ tục cấp tài khoản định danh điện tử các mức độ đối với công dân Việt Nam và đối với người nước ngoài; Trình tự, thủ tục cấp tài khoản định danh điện tử đối với cơ quan, tổ chức; Kích hoạt, sử dụng tài khoản định danh điện tử...