Từ tài chính đến AI: Hành trình táo bạo của Lương Văn Phong và DeepSeek
Câu chuyện về ông Lương Văn Phong, người sáng lập bí ẩn của DeepSeek.
Với việc ra mắt mô hình trí tuệ nhân tạo (AI) mới nhất của mình, DeepSeek, một startup công nghệ của Trung Quốc, đã phá vỡ nhiều năm chính sách của Mỹ nhằm kiềm chế sự đổi mới của Trung Quốc.
Đồng thời, công ty này cũng gây ảnh hưởng nghiêm trọng đến giá trị vốn hóa của nhiều tập đoàn lớn, từ Nvidia (gã khổng lồ sản xuất chip AI của Mỹ) cho đến Siemens Energy (nhà sản xuất thiết bị điện phục vụ các trung tâm dữ liệu).
Thành công của DeepSeek trong việc phát triển công nghệ độc lập với linh kiện xuất khẩu từ Mỹ đã đặt ra câu hỏi về tầm quan trọng của việc tiếp cận chip bán dẫn tiên tiến trong quá trình huấn luyện mô hình AI.
Người đứng sau DeepSeek – Thiên tài bí ẩn của Trung Quốc
Người đứng sau thành công này là ông Lương Văn Phong, nhà sáng lập 40 tuổi của DeepSeek. Hiện vẫn chưa rõ ông có thực sự thích thú với cơn địa chấn thị trường mà mình đã tạo ra hay không. Một người bạn học phổ thông của ông từng chia sẻ với truyền thông địa phương rằng, trong dịp Tết Nguyên đán bắt đầu vào ngày 29/1, ông Lương đã chọn cách ẩn mình tại quê nhà.
![z6295901156224_991b631d4de163ffa2755a9ffbde1940.jpg](https://nqs.1cdn.vn/2025/02/08/z6295901156224_991b631d4de163ffa2755a9ffbde1940.jpg)
Trên mạng xã hội Trung Quốc, ông bị trêu chọc vì ngoại hình gầy gò, xanh xao. Tuy nhiên, với giới công nghệ, ông Lương vẫn là một ẩn số. Những người từng làm việc với DeepSeek cho biết ông là người ám ảnh với trí tuệ nhân tạo tổng quát (AGI – Artificial General Intelligence), một dạng AI có khả năng suy nghĩ và học hỏi giống con người. Chính niềm đam mê này đã khiến ông thách thức những quan niệm về sự tiến bộ công nghệ, không chỉ ở phương Tây mà ngay cả ở Trung Quốc.
Thông tin công khai về ông Lương khá ít ỏi. Sinh năm 1985 trong một gia đình giáo viên tại một ngôi làng nghèo gần thành phố Trạm Giang, miền Nam Trung Quốc, ông bộc lộ tài năng từ sớm. Một giáo viên cũ từng tiết lộ rằng ông đã thành thạo toán cấp đại học khi còn học trung học cơ sở.
Năm 2002, ông thi đỗ vào ngành công nghệ thông tin tại Đại học Chiết Giang, một trong những trường danh giá nhất Trung Quốc. Ông tiếp tục theo học thạc sĩ tại đây dưới sự hướng dẫn của một nhà khoa học hàng đầu về thị giác máy tính, từ đó bắt đầu dấn thân vào lĩnh vực AI.
Thời điểm đó, thành phố Hàng Châu, nơi đặt trụ sở Đại học Chiết Giang, là trung tâm công nghệ Internet sôi động với sự vươn lên của các công ty như Alibaba. Ông Lương và một số bạn học đã ở lại thành phố này, bắt đầu nghiên cứu các mô hình đầu tư định lượng (quantitative investing) – phương pháp giao dịch không dựa trên phân tích cơ bản của doanh nghiệp mà sử dụng dữ liệu khổng lồ để tìm kiếm cơ hội sinh lời.
Bước ngoặt: Từ quỹ đầu tư đến công ty AI hàng đầu
Sự nghiệp của ông Lương bắt đầu tại Hàng Châu, nơi ông cùng bạn học nghiên cứu các mô hình đầu tư định lượng (quantitative investing) – phương pháp giao dịch không dựa trên phân tích cơ bản của doanh nghiệp mà sử dụng dữ liệu khổng lồ để tìm kiếm cơ hội sinh lời.
Năm 2013, ông Lương và 3 người bạn thành lập nhóm đầu tư Yakebi để thương mại hóa các mô hình giao dịch họ đã phát triển và sau đó đồng sáng lập High-Flyer, một quỹ đầu tư định lượng, vào năm 2015.
Quỹ này nhanh chóng phát triển, đạt quy mô quản lý tài sản 100 tỷ NDT (khoảng 14 tỷ USD) vào năm 2021. Tuy nhiên, quy mô của quỹ nhanh chóng thu hẹp vào nửa cuối năm đó do vấp phải sự giám sát chặt chẽ từ giới chức Trung Quốc vì bị coi là trục lợi từ những biến động thị trường.
DeepSeek ra đời như một nhánh nghiên cứu của High-Flyer nhằm cải thiện thuật toán của quỹ. Năm 2019, công ty này rót 200 triệu NDT để thành lập một đơn vị riêng biệt phát triển nền tảng học sâu mang tên Fire-Flyer 1, và thêm 1 tỷ NDT năm 2021 cho phiên bản thứ hai với 10.000 chip Nvidia A100.
Đến năm 2023, DeepSeek tách ra thành công ty độc lập và tạo tiếng vang lớn vào tháng 5/2024 khi tung ra chatbot siêu rẻ dựa trên mô hình V2, buộc các đối thủ lớn như Alibaba, Baidu, ByteDance và Tencent phải điều chỉnh giá dịch vụ AI của họ.
Tuy nhiên, theo ông Lương, việc giảm giá này không phải để giành thêm người dùng. Tháng 7/2024, ông tuyên bố DeepSeek đã khám phá ra các cấu trúc mô hình mới giúp giảm đáng kể chi phí huấn luyện AI – điều mà các công ty khác chưa làm được.
DeepSeek R1
Mô hình mới nhất của DeepSeek, R1, đã gây chấn động trong giới công nghệ phương Tây khi công ty công bố chi phí huấn luyện chỉ dưới 6 triệu USD - một con số khiêm tốn so với các đối thủ như OpenAI (cha đẻ của ChatGPT).
Ngay cả Sam Altman, CEO của OpenAI, cũng phải thừa nhận R1 là một sản phẩm “ấn tượng”, dù ông cam kết rằng OpenAI sẽ tạo ra các mô hình “tốt hơn nhiều”.
Tuy nhiên, nhiều chuyên gia vẫn hoài nghi về tuyên bố tiết kiệm tài nguyên của DeepSeek. Một số ý kiến cho rằng công ty đã áp dụng phương pháp "distillation" - “học” lại từ các mô hình AI của Mỹ. OpenAI thậm chí còn tuyên bố có bằng chứng về việc DeepSeek vi phạm điều khoản dịch vụ bằng cách "học lỏm" mô hình của họ.
Dù DeepSeek có thực sự tạo ra bước đột phá công nghệ hay không, nó vẫn đặt ra thách thức lớn cho cả Thung lũng Silicon lẫn Bắc Kinh.
Truyền thông nhà nước Trung Quốc nhanh chóng ca ngợi DeepSeek như một tài sản quốc gia trong cuộc đua AI. Ngày 20/1/2025, ông Lương được mời gặp Thủ tướng Lý Cường cùng một số doanh nhân hàng đầu khác.
Theo Economist
>> 465 tỷ USD, gần 30 triệu m2 đất phục vụ cơn sốt trung tâm dữ liệu: Liệu có dư thừa?
Khiến Nvidia mất đứt 600 tỷ USD chỉ trong 24h, DeepSeek lại giúp các công ty tí hon hưởng lợi
4 ông lớn công nghệ Mỹ quyết chi 300 tỷ USD chạy đua với DeepSeek