Meta Platforms, công ty mẹ Facebook, đang áp dụng chiến lược 'cho đi để nhận lại' với mô hình ngôn ngữ lớn (LLM) Llama 2 do hãng tự phát triển.
Llama 2 được nhiều người biết đến nhiều hơn sau sự bùng nổ của ChatGPT vào cuối năm 2022. Đây cũng là LLM đứng đằng sau các trợ lý ảo và tích hợp trên các thiết bị đeo VR mà Mark Zuckerberg ra mắt tại hội nghị Kết nối thường niên của công ty tổ chức vào tháng trước.
“Câu đố” dành cho phố Wall
Dù tạo ra sự thích thú cho giới công nghệ, song Llama lại là bài toán khó giải với những nhà đầu tư phố Wall, khi không dễ định giá và gây ra sự khó hiểu nhất định.
Hiện chi phí đầu tư cơ sở hạ tầng và huấn luyện AI đang ở mức cao, Meta đã bỏ “tiền tấn” để phát triển phiên bản đầu tiên của Llama, trước khi cập nhật lên Llama 2 vào tháng 7.
Do đó, việc biến LLM này thành mã nguồn mở, đồng nghĩa Meta đang tặng miễn phí kết quả nghiên cứu của họ dành cho các nhà phát triển, một cách tiếp cận khác biệt đáng kể so với mô hình đăng ký và cấp phép phần mềm truyền thông.
Điều này không giống như cách Facebook sử dụng mảng kinh doanh tiếp thị kỹ thuật số để trở thành gã khổng lồ Internet.
Khi công bố Llama 2, Meta cho biết phiên bản mới sẽ có giấy phép thương mại cho phép các công ty tích hợp vào sản phẩm dịch vụ. Zuckerberg khẳng định không tập trung kiếm tiền trực tiếp từ Llama 2, song trên thực tế Meta đã nhận được một khoản tiền không tiết lộ từ những công ty đám mây như Microsoft và Amazon.
Metaverse (vũ trụ ảo) như tên của công ty, vẫn là một trọng tâm phát triển của gã khổng lồ truyền thông xã hội trong thời gian tới. Song, sự nổi lên như vũ bão của AI tạo sinh khiến Zuckerberg không thể ngồi yên. Meta định vị Llama và hệ sinh thái xung quanh LLM này là một nguồn mở thay thế cho GPT (ChatGPT của OpenAI) hay PaLM 2 (Bard AI của Google).
Các chuyên gia nhận định Llama có vị thế trong lĩnh vực AI tạo sinh tương tự như Linux, đối thủ mã nguồn mở với Microsoft Windows, trên thị trường hệ điều hành máy tính.
Linux có vai trò quan trọng trong thế giới Internet hiện đại, đồng thời đã xâm nhập và trở thành một bộ phận quan trọng với các máy chủ doanh nghiệp trên toàn thế giới. Và đây có lẽ cũng là mục tiêu của Meta với việc phát triển Llama làm nền tảng kỹ thuật số tiềm năng hỗ trợ ứng dụng AI tiếp theo.
Cho đi để nhận lại
Vào tháng 7, Zuckerberg nói rằng những cải tiến do các nhà phát triển bên thứ ba thực hiện đối với Llama có thể làm “tăng hiệu quả”, giúp Meta chạy phần mềm AI của mình rẻ hơn.
Meta cho biết họ dự kiến chi tiêu vốn cho năm 2023 sẽ nằm trong khoảng từ 27 tỷ USD đến 30 tỷ USD, giảm so với mức 32 tỷ USD vào năm ngoái.
Giám đốc tài chính Susan Li cho biết con số này có thể sẽ tăng vào năm 2024, một phần là do các khoản đầu tư liên quan đến trung tâm dữ liệu và AI.
Công ty đặt cược rằng các nhà phát triển bên thứ ba sẽ thường xuyên cập nhật Llama 2 và phần mềm AI liên quan để nó chạy hiệu quả hơn, một cách giao việc nghiên cứu và phát triển cho đội quân tình nguyện viên.
Không chỉ vậy, cộng đồng sử dụng phổ biến LLM cũng mang lại sự ảnh hưởng tích cực. Chẳng hạn, khi các nhà nghiên cứu AI hàng đầu thế giới sử dụng Llama, Meta sẽ có cơ hội dễ dàng tiếp cận tuyển dụng những kỹ sư lành nghề.
Điều này từng được thực hiện với Facebook, nền tảng có lịch sử chuyên sử dụng các dự án nguồn mở, ví dụ như khung mã hoá PyTorch cho ứng dụng học máy, làm công cụ thu hút nhân tài công nghệ muốn đầu quân cho công ty.
Bên cạnh các công cụ điện toán đám mây như Microsoft Azure và Amazon Web Services, Hugging Face là một trong những đối tác quan trọng mà Meta lựa chọn cho Llama 2.
Theo đó, các nhà phát triển, nhà nghiên cứu AI và hàng nghìn công ty sử dụng nền tảng của Hugging Face có thể chia sẻ mã, bộ dữ liệu và mô hình, biến nền tảng này trở thành một trong những cộng đồng lớn nhất trong ngành.
Dù vậy, không phải Meta “cho đi” nghiên cứu của mình hoàn toàn miễn phí. Công ty này yêu cầu những nhà phát triển bên thứ ba phải xin cấp phép phê duyệt sử dụng Llama 2 nếu họ tích hợp vào bất kỳ sản phẩm hay dịch vụ nào có “hơn 700 triệu người dùng hàng tháng”. Bước đi này được cho là nhằm giữ chân những đối thủ trực tiếp như Snap hay TikTok.
Theo một cuộc khảo sát gần đây của TC Cowen với 680 công ty trong lĩnh vực điện toán đám mây, cho thấy, các doanh nghiệp đầu tư vào AI thích sử dụng LLM có sẵn trên thị trường.
Cuộc khảo sát ghi nhận 32% số người được hỏi đã sử dụng hoặc có kế hoạch sử dụng LLM được đóng gói thương mại như phần mềm GPT-4 của OpenAI trong khi 28% tập trung vào LLM nguồn mở như Llama và Falcon. Chỉ 12% số người được hỏi dự định sử dụng LLM nội bộ.
(Theo Bloomberg, CNBC)