Cuộc chiến công khai nhằm thống trị không gian công nghệ AI đã bắt đầu vào cuối năm ngoái với việc ra mắt ChatGPT của OpenAI do Microsoft hậu thuẫn và khiến các đối thủ nặng ký trong lĩnh vực công nghệ từ Alphabet đến Baidu của Trung Quốc tung ra các dịch vụ của riêng họ.
Ảnh: Reuters |
LLaMA (viết tắt của Large Language Model Meta AI) của Meta sẽ được cung cấp theo giấy phép phi thương mại cho các nhà nghiên cứu và các tổ chức liên kết với chính phủ, xã hội dân sự và học viện.
Các mô hình ngôn ngữ lớn khai thác một lượng lớn văn bản để tóm tắt thông tin và tạo nội dung. Mô hình mà Meta cho biết yêu cầu sức mạnh tính toán "ít hơn nhiều" so với các dịch vụ trước đó, được đào tạo trên 20 ngôn ngữ, tập trung vào những ngôn ngữ có bảng chữ cái Latinh và Cyrillic.
Gil Luria, nhà phân tích phần mềm cao cấp cho hay: "AI có tính sáng tạo là một ứng dụng mới của AI mà Meta có ít kinh nghiệm, nhưng rõ ràng là rất quan trọng đối với tương lai kinh doanh của họ".
AI đã nổi lên như một điểm sáng cho các khoản đầu tư vào ngành công nghệ, ngành mà tốc độ tăng trưởng chậm lại đã dẫn đến tình trạng sa thải nhân công trên diện rộng và cắt giảm các hoạt động thử nghiệm trong thời gian gần đây.
Meta cho biết LLaMA có thể vượt trội so với các đối thủ khi kiểm tra nhiều tham số hoặc biến số hơn. Cụ thể, họ cho biết một phiên bản LLaMA với 13 tỷ tham số có thể hoạt động tốt hơn GPT-3, phiên bản tiền thân gần đây của mô hình mà ChatGPT được xây dựng.
Người phát ngôn của Meta cho rằng hiệu suất đạt được là nhờ số lượng lớn dữ liệu "sạch hơn" và "cải tiến kiến trúc" trong mô hình giúp nâng cao tính ổn định của chatbot.
Vào tháng 5 năm ngoái, Meta đã phát hành mô hình ngôn ngữ lớn OPT-175B, cũng nhằm vào các nhà nghiên cứu, tạo cơ sở cho một phiên bản mới của chatbot BlenderBot.
Sau đó, họ đã giới thiệu một mô hình có tên là Galactica có thể viết các bài báo khoa học và giải các bài toán, nhưng đã nhanh chóng gỡ bỏ bản demo sau khi nó tạo ra các phản hồi không chuẩn xác.
(Theo Công luận)