Thế giới

Chân dung tỷ phú quỹ đầu cơ kín tiếng đứng sau Deepseek, khiến cả thế giới sửng sốt

Thanh Lê • 29/01/2025 16:45

Tỷ phú quỹ đầu cơ Liang Wenfeng đã xây dựng mô hình trên ngân sách eo hẹp bất chấp nỗ lực của Hoa Kỳ nhằm ngăn chặn tham vọng công nghệ cao của Trung Quốc.

Một phòng thí nghiệm trí tuệ nhân tạo nhỏ của Trung Quốc đã khiến cả thế giới sửng sốt khi tiết lộ công thức kỹ thuật cho mô hình tiên tiến của mình.

Sự kiện này đã biến nhà sáng lập Liang Wenfeng từ một nhà quản lý quỹ đầu tư kín tiếng trở thành anh hùng dân tộc, bất chấp những nỗ lực của Mỹ nhằm kiềm chế tham vọng công nghệ cao của Trung Quốc.

DeepSeek có khả năng tự học và cải thiện mà không cần sự giám sát của con người

DeepSeek, do nhà quản lý quỹ đầu cơ Liang Wenfeng thành lập, đã công bố mô hình R1 vào thứ Hai, kèm theo một báo cáo chi tiết về cách xây dựng một mô hình ngôn ngữ lớn với ngân sách hạn chế, có khả năng tự học và cải thiện mà không cần sự giám sát của con người.

Các công ty Mỹ như OpenAI và Google DeepMind đã tiên phong trong việc phát triển các mô hình lập luận, một lĩnh vực nghiên cứu AI mới nhằm đưa mô hình đạt được khả năng nhận thức tương tự con người. Tháng 12 vừa qua, OpenAI có trụ sở tại San Francisco đã phát hành phiên bản đầy đủ của mô hình o1 nhưng giữ kín phương pháp phát triển của mình.

Việc DeepSeek công bố mô hình R1 đã gây ra một cuộc tranh luận sôi nổi tại Thung lũng Silicon về việc liệu các công ty AI Mỹ có nguồn lực dồi dào như Meta và Anthropic có thể duy trì lợi thế công nghệ của họ hay không.

Trong khi đó, tại quê nhà, Liang Wenfeng trở thành tâm điểm của niềm tự hào dân tộc. Tuần này, ông là nhà lãnh đạo AI duy nhất được chọn tham dự cuộc họp với Phó Thủ tướng Lý Cường. Các doanh nhân tham gia cuộc họp được kêu gọi "tập trung nỗ lực để đột phá các công nghệ cốt lõi quan trọng".

Năm 2021, Liang bắt đầu mua hàng nghìn bộ xử lý đồ họa (GPU) của Nvidia cho dự án AI của mình trong khi vẫn điều hành quỹ giao dịch định lượng High-Flyer. Nhiều người trong ngành khi đó coi đây là hành động kỳ lạ của một tỷ phú đang tìm kiếm sở thích mới.

"Khi lần đầu gặp ông ấy, chúng tôi thấy đó là một người đam mê công nghệ với kiểu tóc kỳ lạ, nói về việc xây dựng cụm máy tính 10.000 chip để huấn luyện mô hình AI của riêng mình. Chúng tôi không nghĩ đó là điều nghiêm túc", một đối tác kinh doanh của Liang chia sẻ.

"Ông ấy không thể diễn đạt rõ ràng tầm nhìn của mình ngoài câu: 'Tôi muốn xây dựng thứ này, và nó sẽ tạo ra bước ngoặt'. Chúng tôi từng nghĩ điều đó chỉ khả thi với những tập đoàn lớn như ByteDance hay Alibaba".

Thành công nhờ tư duy khác biệt

Việc Liang xuất thân từ lĩnh vực tài chính thay vì công nghệ lại trở thành một lợi thế bất ngờ. Tại High-Flyer, ông đã kiếm bộn tiền nhờ sử dụng AI và thuật toán để phát hiện các mô hình ảnh hưởng đến giá cổ phiếu. Đội ngũ của ông có kinh nghiệm tận dụng chip Nvidia để tối ưu giao dịch chứng khoán. Năm 2023, Liang thành lập DeepSeek với tham vọng phát triển AI có khả năng ngang tầm con người.

"Liang đã xây dựng một đội ngũ hạ tầng xuất sắc, thực sự hiểu cách vận hành chip", một nhà sáng lập công ty LLM đối thủ nhận xét. "Ông ấy đã mang theo những nhân sự giỏi nhất từ quỹ đầu cơ sang DeepSeek".

Một nhà nghiên cứu AI khác cho biết: "Kỹ sư của DeepSeek biết cách khai thác tối đa tiềm năng của các GPU, ngay cả khi chúng không phải là loại tiên tiến nhất".

Các chuyên gia trong ngành nhận định rằng việc DeepSeek tập trung thuần túy vào nghiên cứu khiến họ trở thành đối thủ đáng gờm, vì họ sẵn sàng chia sẻ những đột phá thay vì giữ bí mật để thu lợi thương mại. DeepSeek chưa huy động vốn từ bên ngoài và cũng chưa có động thái thương mại hóa mô hình của mình.

"DeepSeek hoạt động giống như giai đoạn đầu của DeepMind," một nhà đầu tư AI tại Bắc Kinh nhận xét. "Họ chỉ tập trung vào nghiên cứu và kỹ thuật".

Liang, người trực tiếp tham gia vào nghiên cứu của DeepSeek, dùng lợi nhuận từ quỹ đầu cơ để trả lương cao cho những nhân tài AI hàng đầu. Cùng với ByteDance, DeepSeek được biết đến là nơi trả mức lương cao nhất cho kỹ sư AI tại Trung Quốc, với văn phòng đặt tại Hàng Châu và Bắc Kinh.

"Văn phòng của DeepSeek giống như một khuôn viên đại học dành cho các nhà nghiên cứu nghiêm túc," một đối tác kinh doanh nhận xét. "Đội ngũ ở đây tin vào tầm nhìn của Liang: chứng minh rằng người Trung Quốc có thể sáng tạo và xây dựng từ con số không."

DeepSeek định vị mình là một công ty "thuần Trung Quốc", với nhân sự là tiến sĩ từ các trường danh tiếng trong nước như Đại học Bắc Kinh, Thanh Hoa và Hàng không Bắc Kinh, thay vì tuyển dụng chuyên gia từ các viện nghiên cứu của Mỹ.

Trong một cuộc phỏng vấn với truyền thông trong nước năm ngoái, Liang tuyên bố: "Đội ngũ nòng cốt của chúng tôi không có ai trở về từ nước ngoài. Tất cả đều là nhân tài trong nước... Chúng ta phải tự đào tạo nhân tài hàng đầu". Nhờ đó, DeepSeek nhận được nhiều lời ca ngợi tại Trung Quốc.

DeepSeek tuyên bố đã sử dụng 2.048 Nvidia H800 và 5,6 triệu USD để huấn luyện một mô hình với 671 tỷ tham số, chỉ bằng một phần nhỏ so với chi phí của OpenAI và Google để phát triển các mô hình có quy mô tương tự.

Ritwik Gupta, nhà nghiên cứu chính sách AI tại Đại học California, Berkeley, nhận định rằng các động thái gần đây của DeepSeek cho thấy "không có rào cản vững chắc nào trong lĩnh vực AI".

"Người đi đầu phải tốn rất nhiều nguồn lực để đạt được thành tựu ban đầu," Gupta nói. "Nhưng người đi sau có thể đạt được kết quả tương tự nhanh hơn và với chi phí thấp hơn".

Ông cũng cho rằng Trung Quốc có một lượng lớn kỹ sư hệ thống, những người hiểu rõ cách tận dụng tài nguyên tính toán để huấn luyện và vận hành mô hình một cách hiệu quả hơn so với Mỹ.

Mặc dù DeepSeek đã đạt được kết quả ấn tượng với nguồn lực hạn chế, nhưng vẫn còn nhiều dấu hỏi về việc họ có thể duy trì tính cạnh tranh trong tương lai hay không. Năm 2024, lợi nhuận của High-Flyer, nhà tài trợ chính của DeepSeek, đã sụt giảm, một phần vì Liang dành phần lớn thời gian cho DeepSeek.

Các đối thủ Mỹ cũng không ngừng tiến lên. Họ đang xây dựng các "cụm" máy tính khổng lồ sử dụng chip Nvidia Blackwell thế hệ mới, tạo ra sức mạnh tính toán có thể tiếp tục nới rộng khoảng cách với Trung Quốc.

Tuần này, OpenAI công bố liên doanh với SoftBank của Nhật, mang tên Stargate, với kế hoạch đầu tư ít nhất 100 tỷ USD vào hạ tầng AI tại Mỹ. Elon Musk cũng đang mở rộng siêu máy tính Colossus của xAI lên hơn 1 triệu GPU để huấn luyện các mô hình AI Grok.

"DeepSeek hiện có một trong những cụm máy tính tiên tiến nhất Trung Quốc", một đối tác của Liang nói. "Họ đủ sức cạnh tranh lúc này, nhưng trong tương lai thì chưa chắc".

Theo FT

>> Startup Trung Quốc tung mô hình AI giá siêu rẻ nhưng mạnh ngang ChatGPT, Mỹ và Nvidia có nên lo lắng?

Chân dung tỷ phú quỹ đầu cơ kín tiếng đứng sau Deepseek, khiến cả thế giới sửng sốt

Xuất hiện ngày càng nhiều tỷ phú AI, 'ngôi vương' gây bất ngờ với khối tài sản 36 tỷ USD

Vượt lãnh đạo OpenAI, người đàn ông Trung Quốc trở thành tỷ phú AI giàu nhất thế giới

DeepSeek tự phát triển chip AI, quyết giảm phụ thuộc Nvidia, sẵn sàng cạnh tranh Huawei

Mỹ bất ngờ hoãn đưa DeepSeek cùng hơn 100 doanh nghiệp Trung Quốc vào danh sách đen

‘Honda CR-V bản đặc biệt’ giá 535 triệu, phù hợp với gia đình Việt: Thiết kế thể thao, nội thất ‘ngập tràn’ công nghệ, 11 túi khí cùng tích hợp AI, Mazda CX-5 phải lo lắng

DeepSeek

Trung Quốc

AI

Nvidia

Mỹ

SpaceX mất 40% giá trị, vốn hóa 'bốc hơi' hơn 1.000 tỷ USD sau IPO lớn nhất lịch sử

Phát hiện 5.814 thí sinh có điểm thi bất thường, nghi sửa hơn 3.000 bài thi để 'chạy' biên chế công chức tại Thái Lan

Tổng thống Mỹ Trump công bố thông tin quan trọng trong bài phát biểu giờ vàng

Iran tiếp tục nhắm mục tiêu vào loạt căn cứ Mỹ ở Trung Đông, cảnh báo giai đoạn trả đũa tiếp theo

Khủng hoảng hàng không: Châu Âu có thể thiếu gần 600.000 thùng nhiên liệu bay mỗi ngày

TSMC báo lãi kỷ lục gần 22 tỷ USD trong quý II, tăng 77% nhờ cơn sốt chip AI

Việt Nam được dự báo vượt Thái Lan, vào top 3 thị trường ô tô Đông Nam Á trong năm 2026

SpaceX mất 40% giá trị, vốn hóa 'bốc hơi' hơn 1.000 tỷ USD sau IPO lớn nhất lịch sử

Liên danh Đèo Cả được 6 ngân hàng rót hơn 27.000 tỷ đồng để làm tuyến cao tốc huyết mạch

6 ngân hàng ‘rót’ hơn 27.000 tỷ đồng cho CII làm cao tốc: Quy mô tài trợ vốn tín dụng BOT lớn nhất Việt Nam

Biến động mạnh trong phiên đáo hạn phái sinh: VN-Index lấy lại mốc 1.800 điểm, khối ngoại vung tiền gom VIC, VHM, ACB

Có 500 triệu trong tay, người mua xe lần đầu nên chọn sedan hay SUV?

Đứng trước Phó Thủ tướng, Chủ tịch Petrolimex tự thừa nhận nhiều điểm yếu của tập đoàn

Phát hiện 5.814 thí sinh có điểm thi bất thường, nghi sửa hơn 3.000 bài thi để 'chạy' biên chế công chức tại Thái Lan

Chính thức ký hợp đồng tín dụng hơn 27.000 tỷ cho dự án mở rộng cao tốc trọng điểm phía Nam do liên danh Đèo Cả đầu tư

Bắt Nguyễn Đức Toàn SN 1998 và 8 'nhân viên', thu giữ 41 máy tính, 4 xe mô tô, 10 điện thoại di động

Điện hạt nhân Ninh Thuận: Đề xuất tách thành 3 dự án độc lập

ABBank hoàn tất trả cổ tức 15% bằng cổ phiếu, vốn điều lệ vượt 16.000 tỷ đồng

Tổng thống Mỹ Trump công bố thông tin quan trọng trong bài phát biểu giờ vàng

Thống nhất đề xuất tăng lương tối thiểu vùng cao nhất đến 390.000 đồng

Iran tiếp tục nhắm mục tiêu vào loạt căn cứ Mỹ ở Trung Đông, cảnh báo giai đoạn trả đũa tiếp theo