Meta chính thức ‘chen chân’ vào cuộc đua AI

Mô hình có tên LLaMA, viết tắt của Large Language Model Meta AI, nhằm giúp các nhà khoa học và kỹ sư khám phá các ứng dụng cho AI như trả lời câu hỏi và tóm tắt tài liệu.

Sản phẩm này sẽ được cung cấp theo giấy phép phi thương mại cho các nhà nghiên cứu và các tổ chức liên kết với chính phủ, xã hội dân sự và học viện, theo bài đăng của CEO Meta Mark Zuckerberg hôm 24/2.

Công ty sẽ cung cấp mã cơ bản để người dùng điều chỉnh mô hình và sử dụng nó cho các trường hợp sử dụng liên quan đến nghiên cứu. Mô hình, mà theo Meta là yêu cầu sức mạnh tính toán “ít hơn nhiều”, được đào tạo trên 20 ngôn ngữ, tập trung vào những ngôn ngữ có bảng chữ cái Latinh và Cyrillic.

Trong bài đăng hôm 24/2, Mark Zuckerberg cho biết công nghệ LLM thậm chí có thể giải các bài toán hoặc tiến hành nghiên cứu khoa học.

“Mô hình LLM đã cho thấy nhiều hứa hẹn trong việc tạo văn bản, trò chuyện, tóm tắt tài liệu bằng văn bản và các nhiệm vụ phức tạp hơn như giải các định lý toán học hoặc dự đoán cấu trúc protein,” ông Zuckerberg viết.

Meta cũng cho rằng mô hình LLM của công ty đặc trưng hơn so với các mô hình cạnh tranh.

Ví dụ, công ty cho biết LLM sẽ có nhiều kích cỡ, từ 7 tỷ tham số đến 65 tỷ tham số, trong khi Chat-GPT 3 của OpenAI có 175 tỷ tham số. Theo đó, các mô hình lớn hơn đã thành công trong những năm gần đây trong việc mở rộng khả năng của công nghệ, nhưng chúng tốn nhiều chi phí hơn để vận hành, do đó các mô hình nhỏ gọn sẽ đi kèm với việc chi phí phải trả thấp hơn.

Việc Meta phát hành mô hình mới, được phát triển bởi nhóm Nghiên cứu AI cơ bản (FAIR), diễn ra khi các công ty công nghệ lớn và các công ty khởi nghiệp có vốn đầu tư lớn chạy đua để chào hàng những tiến bộ trong kỹ thuật trí tuệ nhân tạo và tích hợp công nghệ này vào các sản phẩm thương mại.

Gil Luria, nhà phân tích phần mềm cao cấp tại DA Davidson cho biết: “Thông báo của Meta ngày hôm nay dường như là một bước thử nghiệm khả năng AI tổng quát của họ để họ có thể triển khai chúng vào các sản phẩm trong tương lai”.

“AI sáng tạo là một ứng dụng mới của AI mà Meta có ít kinh nghiệm hơn, nhưng rõ ràng là rất quan trọng đối với tương lai kinh doanh của họ”, ông Luria nói thêm.

Vào tháng 5 năm ngoái, Meta đã phát hành mô hình ngôn ngữ lớn OPT-175B, cũng nhằm vào các nhà nghiên cứu, tạo cơ sở cho một phiên bản mới của chatbot BlenderBot.

Sau đó, công ty đã tung ra một mô hình có tên là Galactica, được cho là có thể viết các bài báo khoa học và giải các bài toán, nhưng bản demo của mô hình này sau đó đã bị gỡ xuống vì nó liên tục tạo ra những nội dung “nghe có vẻ đáng tin cậy”.

Xem thêm >> ‘Cha đẻ’ của internet cảnh báo: Đừng vội đầu tư vào AI chỉ vì ChatGPT ‘thú vị’