Thế giới

Chân dung tỷ phú quỹ đầu cơ kín tiếng đứng sau Deepseek, khiến cả thế giới sửng sốt

Thanh Lê 29/01/2025 16:45

Tỷ phú quỹ đầu cơ Liang Wenfeng đã xây dựng mô hình trên ngân sách eo hẹp bất chấp nỗ lực của Hoa Kỳ nhằm ngăn chặn tham vọng công nghệ cao của Trung Quốc.

Một phòng thí nghiệm trí tuệ nhân tạo nhỏ của Trung Quốc đã khiến cả thế giới sửng sốt khi tiết lộ công thức kỹ thuật cho mô hình tiên tiến của mình.

Sự kiện này đã biến nhà sáng lập Liang Wenfeng từ một nhà quản lý quỹ đầu tư kín tiếng trở thành anh hùng dân tộc, bất chấp những nỗ lực của Mỹ nhằm kiềm chế tham vọng công nghệ cao của Trung Quốc.

065bb5c1-0851-468a-ae5a-97f837e451bd.jpeg
DeepSeek có khả năng tự học và cải thiện mà không cần sự giám sát của con người

DeepSeek, do nhà quản lý quỹ đầu cơ Liang Wenfeng thành lập, đã công bố mô hình R1 vào thứ Hai, kèm theo một báo cáo chi tiết về cách xây dựng một mô hình ngôn ngữ lớn với ngân sách hạn chế, có khả năng tự học và cải thiện mà không cần sự giám sát của con người.

Các công ty Mỹ như OpenAI và Google DeepMind đã tiên phong trong việc phát triển các mô hình lập luận, một lĩnh vực nghiên cứu AI mới nhằm đưa mô hình đạt được khả năng nhận thức tương tự con người. Tháng 12 vừa qua, OpenAI có trụ sở tại San Francisco đã phát hành phiên bản đầy đủ của mô hình o1 nhưng giữ kín phương pháp phát triển của mình.

Việc DeepSeek công bố mô hình R1 đã gây ra một cuộc tranh luận sôi nổi tại Thung lũng Silicon về việc liệu các công ty AI Mỹ có nguồn lực dồi dào như Meta và Anthropic có thể duy trì lợi thế công nghệ của họ hay không.

Trong khi đó, tại quê nhà, Liang Wenfeng trở thành tâm điểm của niềm tự hào dân tộc. Tuần này, ông là nhà lãnh đạo AI duy nhất được chọn tham dự cuộc họp với Phó Thủ tướng Lý Cường. Các doanh nhân tham gia cuộc họp được kêu gọi "tập trung nỗ lực để đột phá các công nghệ cốt lõi quan trọng".

Năm 2021, Liang bắt đầu mua hàng nghìn bộ xử lý đồ họa (GPU) của Nvidia cho dự án AI của mình trong khi vẫn điều hành quỹ giao dịch định lượng High-Flyer. Nhiều người trong ngành khi đó coi đây là hành động kỳ lạ của một tỷ phú đang tìm kiếm sở thích mới.

"Khi lần đầu gặp ông ấy, chúng tôi thấy đó là một người đam mê công nghệ với kiểu tóc kỳ lạ, nói về việc xây dựng cụm máy tính 10.000 chip để huấn luyện mô hình AI của riêng mình. Chúng tôi không nghĩ đó là điều nghiêm túc", một đối tác kinh doanh của Liang chia sẻ.

"Ông ấy không thể diễn đạt rõ ràng tầm nhìn của mình ngoài câu: 'Tôi muốn xây dựng thứ này, và nó sẽ tạo ra bước ngoặt'. Chúng tôi từng nghĩ điều đó chỉ khả thi với những tập đoàn lớn như ByteDance hay Alibaba".

Thành công nhờ tư duy khác biệt

Việc Liang xuất thân từ lĩnh vực tài chính thay vì công nghệ lại trở thành một lợi thế bất ngờ. Tại High-Flyer, ông đã kiếm bộn tiền nhờ sử dụng AI và thuật toán để phát hiện các mô hình ảnh hưởng đến giá cổ phiếu. Đội ngũ của ông có kinh nghiệm tận dụng chip Nvidia để tối ưu giao dịch chứng khoán. Năm 2023, Liang thành lập DeepSeek với tham vọng phát triển AI có khả năng ngang tầm con người.

"Liang đã xây dựng một đội ngũ hạ tầng xuất sắc, thực sự hiểu cách vận hành chip", một nhà sáng lập công ty LLM đối thủ nhận xét. "Ông ấy đã mang theo những nhân sự giỏi nhất từ quỹ đầu cơ sang DeepSeek".

Một nhà nghiên cứu AI khác cho biết: "Kỹ sư của DeepSeek biết cách khai thác tối đa tiềm năng của các GPU, ngay cả khi chúng không phải là loại tiên tiến nhất".

Các chuyên gia trong ngành nhận định rằng việc DeepSeek tập trung thuần túy vào nghiên cứu khiến họ trở thành đối thủ đáng gờm, vì họ sẵn sàng chia sẻ những đột phá thay vì giữ bí mật để thu lợi thương mại. DeepSeek chưa huy động vốn từ bên ngoài và cũng chưa có động thái thương mại hóa mô hình của mình.

"DeepSeek hoạt động giống như giai đoạn đầu của DeepMind," một nhà đầu tư AI tại Bắc Kinh nhận xét. "Họ chỉ tập trung vào nghiên cứu và kỹ thuật".

Liang, người trực tiếp tham gia vào nghiên cứu của DeepSeek, dùng lợi nhuận từ quỹ đầu cơ để trả lương cao cho những nhân tài AI hàng đầu. Cùng với ByteDance, DeepSeek được biết đến là nơi trả mức lương cao nhất cho kỹ sư AI tại Trung Quốc, với văn phòng đặt tại Hàng Châu và Bắc Kinh.

"Văn phòng của DeepSeek giống như một khuôn viên đại học dành cho các nhà nghiên cứu nghiêm túc," một đối tác kinh doanh nhận xét. "Đội ngũ ở đây tin vào tầm nhìn của Liang: chứng minh rằng người Trung Quốc có thể sáng tạo và xây dựng từ con số không."

DeepSeek định vị mình là một công ty "thuần Trung Quốc", với nhân sự là tiến sĩ từ các trường danh tiếng trong nước như Đại học Bắc Kinh, Thanh Hoa và Hàng không Bắc Kinh, thay vì tuyển dụng chuyên gia từ các viện nghiên cứu của Mỹ.

Trong một cuộc phỏng vấn với truyền thông trong nước năm ngoái, Liang tuyên bố: "Đội ngũ nòng cốt của chúng tôi không có ai trở về từ nước ngoài. Tất cả đều là nhân tài trong nước... Chúng ta phải tự đào tạo nhân tài hàng đầu". Nhờ đó, DeepSeek nhận được nhiều lời ca ngợi tại Trung Quốc.

DeepSeek tuyên bố đã sử dụng 2.048 Nvidia H800 và 5,6 triệu USD để huấn luyện một mô hình với 671 tỷ tham số, chỉ bằng một phần nhỏ so với chi phí của OpenAI và Google để phát triển các mô hình có quy mô tương tự.

Ritwik Gupta, nhà nghiên cứu chính sách AI tại Đại học California, Berkeley, nhận định rằng các động thái gần đây của DeepSeek cho thấy "không có rào cản vững chắc nào trong lĩnh vực AI".

"Người đi đầu phải tốn rất nhiều nguồn lực để đạt được thành tựu ban đầu," Gupta nói. "Nhưng người đi sau có thể đạt được kết quả tương tự nhanh hơn và với chi phí thấp hơn".

Ông cũng cho rằng Trung Quốc có một lượng lớn kỹ sư hệ thống, những người hiểu rõ cách tận dụng tài nguyên tính toán để huấn luyện và vận hành mô hình một cách hiệu quả hơn so với Mỹ.

Mặc dù DeepSeek đã đạt được kết quả ấn tượng với nguồn lực hạn chế, nhưng vẫn còn nhiều dấu hỏi về việc họ có thể duy trì tính cạnh tranh trong tương lai hay không. Năm 2024, lợi nhuận của High-Flyer, nhà tài trợ chính của DeepSeek, đã sụt giảm, một phần vì Liang dành phần lớn thời gian cho DeepSeek.

Các đối thủ Mỹ cũng không ngừng tiến lên. Họ đang xây dựng các "cụm" máy tính khổng lồ sử dụng chip Nvidia Blackwell thế hệ mới, tạo ra sức mạnh tính toán có thể tiếp tục nới rộng khoảng cách với Trung Quốc.

Tuần này, OpenAI công bố liên doanh với SoftBank của Nhật, mang tên Stargate, với kế hoạch đầu tư ít nhất 100 tỷ USD vào hạ tầng AI tại Mỹ. Elon Musk cũng đang mở rộng siêu máy tính Colossus của xAI lên hơn 1 triệu GPU để huấn luyện các mô hình AI Grok.

"DeepSeek hiện có một trong những cụm máy tính tiên tiến nhất Trung Quốc", một đối tác của Liang nói. "Họ đủ sức cạnh tranh lúc này, nhưng trong tương lai thì chưa chắc".

Theo FT

>> Startup Trung Quốc tung mô hình AI giá siêu rẻ nhưng mạnh ngang ChatGPT, Mỹ và Nvidia có nên lo lắng?

Phơi bày 2 rủi ro cực lớn của các Big Tech, DeepSeek sẽ chọc vỡ bong bóng AI nghìn tỷ USD trên TTCK Mỹ?

CEO OpenAI Sam Altman lên tiếng ca ngợi ‘AI giá rẻ’ DeepSeek

Theo thitruongtaichinh.kinhtedothi.vn
https://thitruongtaichinh.kinhtedothi.vn/nhip-song-do-day/chan-dung-ty-phu-quy-dau-co-kin-tieng-dung-sau-deepseek-khien-ca-the-gioi-sung-sot-135733.html
Bài liên quan
Đừng bỏ lỡ
    Đặc sắc
    Nổi bật Người quan sát
    Chân dung tỷ phú quỹ đầu cơ kín tiếng đứng sau Deepseek, khiến cả thế giới sửng sốt
    POWERED BY ONECMS & INTECH