Cơn Ác Mộng của OpenAI: DeepSeek R1 Đang Phá Vỡ Ngành AI Như Thế Nào
Một vài dòng mô tả ngắn gọn ở đây, sự thống trị của OpenAI trong lĩnh vực AI đang bị thách thức bởi một startup mới có tên là DeepSeek, công ty đã tạo ra một mô hình open weights mới có tên là R1, được cho là đánh bại các mô hình tốt nhất của OpenAI ở hầu hết các chỉ số.
Giới thiệu về DeepSeek R1

Đây là chú thích cho ảnh 1, OpenAI's Nightmare
DeepSeek R1, một startup AI mới được điều hành bởi một quỹ đầu cơ Trung Quốc, đã tạo ra một mô hình open weights mới có tên R1, được cho là đánh bại các mô hình tốt nhất của OpenAI ở hầu hết các chỉ số. Điều này đã gây ra một làn sóng chấn động trong lĩnh vực AI, với nhiều người tự hỏi làm thế nào một startup tương đối nhỏ có thể đạt được những kết quả ấn tượng như vậy.
Pi 5 Thực Sự Có Thể Làm Được Gì?

Đây là chú thích cho ảnh 2, Pi 5 Capabilities
Pi 5, một máy tính nhỏ và tương đối rẻ tiền, có thể chạy mô hình DeepSeek R1, nhưng chỉ với một số hạn chế. Mô hình này có thể chắt lọc các mô hình khác để làm cho chúng chạy tốt hơn trên phần cứng chậm hơn, có nghĩa là Raspberry Pi có thể chạy một trong những mô hình quen AI cục bộ tốt nhất.
Đánh Bại OpenAI Chỉ Với 1% Tài Nguyên

Đây là chú thích cho ảnh 3, DeepSeek R1 671b
Mô hình của DeepSeek có thể đánh bại các mô hình tốt nhất của OpenAI ở hầu hết các chỉ số, và họ đã làm được điều đó với 6 triệu đô la, với GPU chạy ở một nửa băng thông bộ nhớ của OpenAI. Đây là một thành tựu đáng kể, vì toàn bộ mô hình kinh doanh của OpenAI dựa trên việc mọi người không có quyền truy cập vào nguồn năng lượng và GPU điên rồ để đào tạo và chạy các mô hình AI khổng lồ.
Chạy DeepSeek R1 Trên Raspberry Pi

Đây là chú thích cho ảnh 4, Raspberry Pi
Mặc dù Raspberry Pi về mặt kỹ thuật có thể chạy DeepSeek R1, nhưng nó không giống như DeepSeek R1 671b, là một mô hình 400 GB đòi hỏi một lượng lớn GPU compute. Tuy nhiên, mô hình 14b nhỏ hơn có thể chạy trên Raspberry Pi, mặc dù chậm, với khoảng 1.2 token mỗi giây.
Tăng Tốc DeepSeek R1 Với Card Đồ Họa Ngoài

Đây là chú thích cho ảnh 5, External Graphics Card
Để tăng tốc DeepSeek R1, có thể sử dụng card đồ họa ngoài, có thể cung cấp một sự tăng cường đáng kể về hiệu suất. Với card đồ họa AMD W7700, mô hình có thể chạy với khoảng 20-50 token mỗi giây, tùy thuộc vào loại công việc đang được thực hiện.
Chạy DeepSeek R1 Trên Máy Chủ

Đây là chú thích cho ảnh 6, Server
DeepSeek R1 cũng có thể được chạy trên máy chủ, có thể cung cấp hiệu suất ấn tượng hơn nữa. Với một máy chủ 192 lõi, mô hình có thể chạy với khoảng 4 token mỗi giây, đây là một cải tiến đáng kể so với Raspberry Pi.
GPU Trên Raspberry Pi và Các Bo Mạch Arm Khác

Đây là chú thích cho ảnh 7, GPUs on Raspberry Pi
Ngoài ra còn có các tùy chọn để chạy GPU trên Raspberry Pi và các bo mạch Arm khác, có thể cung cấp một sự tăng cường đáng kể về hiệu suất. Với GPU AMD hoạt động tốt và trình điều khiển mã nguồn mở Intel cũng hoạt động, có nhiều tùy chọn có sẵn cho những người muốn chạy các mô hình AI trên các thiết bị dựa trên Arm.
Kết luận
AI vẫn còn trong một bong bóng khổng lồ, với việc Nvidia mất hơn nửa nghìn tỷ đô la giá trị trong một ngày sau khi DeepSeek được ra mắt. Tuy nhiên, điều này không có nghĩa là AI không phải là một công nghệ quan trọng và có nhiều ứng dụng tiềm năng cho các mô hình AI như DeepSeek R1. Khi công nghệ tiếp tục phát triển, sẽ rất thú vị để xem nó được sử dụng như thế nào và những ứng dụng tiềm năng nào nó có thể có.