AI 24h | 🚀Laptop sắp chạy được AI 120 tỷ tham số

Chào bạn, Minh Trung đây! 👋

Từ khóa tuần này: Mọi thứ rẻ hơn, nhanh hơn, thông minh hơn — và bằng cách nào đó, lại đắt hơn.

Đó là câu mở đầu buổi cập nhật AI tuần này, và nó tóm gọn một nghịch lý kỳ lạ. Mô hình AI ngày càng rẻ, máy tính cá nhân sắp chạy được AI cỡ lớn ngay tại nhà, mô hình Trung Quốc đã áp sát đỉnh bảng xếp hạng. Nhưng cùng lúc, hóa đơn AI của nhiều người lại tăng, và làn sóng sa thải vẫn tiếp diễn.

Tuần này cũng có một câu nói đáng dừng lại suy nghĩ — từ chính người đứng đầu Anthropic: "Loài người sắp được trao một quyền lực gần như không tưởng. Và chưa rõ liệu chúng ta có đủ trưởng thành để sử dụng nó hay không."

Cùng xem 5 tín hiệu quan trọng nhất.

🇨🇳 1. GLM 5.1 vượt Google và OpenAI — chỉ còn xếp sau Claude

Bạn còn nhớ cảm giác lần đầu thấy một thương hiệu lạ vượt mặt tên tuổi lớn không? Giống ngày xe điện Trung Quốc bất ngờ lọt top doanh số toàn cầu — nhiều người ngỡ ngàng.

Tuần này, GLM 5.1 — mô hình AI từ Zhipu (Trung Quốc) — leo lên gần đỉnh bảng xếp hạng chất lượng, vượt qua cả Google và OpenAI, chỉ còn xếp sau Claude. Đây không phải trường hợp cá biệt: Qwen 3.7 Max (Alibaba) cho chất lượng tương đương các mô hình hàng đầu nhưng rẻ và nhanh hơn, còn MiniMax M3 xử lý cả văn bản, hình ảnh, video với cửa sổ ngữ cảnh 1 triệu token.

Vài năm trước, cuộc đua AI gần như là sân chơi riêng của các công ty Mỹ. Giờ thì khác hẳn — các mô hình Trung Quốc bám sát từng bậc, nhiều mô hình còn mã nguồn mở để ai cũng tải về dùng.

Điều này có ý nghĩa gì với bạn? Càng nhiều mô hình giỏi cạnh tranh, người dùng càng được lợi — giá giảm, chất lượng tăng, lựa chọn nhiều hơn. Bạn không bị khóa vào một nhà cung cấp duy nhất. Nhưng cũng cần lưu ý: mô hình từ mỗi quốc gia có thể mang theo thiên lệch văn hóa và quy định nội dung riêng — nên cân nhắc dữ liệu của mình đi đâu trước khi dùng cho việc nhạy cảm. Vì vậy mà tôi monng chờ nhiều mô hình của Việt Nam xuất hiện theo đúng kiểu người Việt Nam dùng mô hình Việt Nam.

💡 2. Mẹo tiết kiệm 90%: đừng dùng giám đốc để photo tài liệu

Đây là phần thực dụng nhất tuần này — áp dụng được ngay nếu bạn đang dùng AI cho công việc.

Hãy hình dung một văn phòng: bạn không giao cho giám đốc đi photo tài liệu hay nhập số liệu. Việc quan trọng (lập chiến lược) thì cần người giỏi; việc lặp đi lặp lại (sao chép, sắp xếp) thì giao người phù hợp hơn. AI cũng nên vậy.

Mô hình mạnh nhất hiện có giá khoảng $15 cho đầu vào và $75 cho đầu ra mỗi triệu token — rất đáng cho việc khó như lập kế hoạch, thiết kế kiến trúc. Nhưng với việc đơn giản (đọc email, sắp xếp tệp, xử lý dữ liệu thô), bạn có thể dùng mô hình rẻ hơn 50-70 lần mà kết quả vẫn ổn. Cách làm: để mô hình mạnh "lên kế hoạch", rồi giao mô hình rẻ "thực thi" — tiết kiệm tới 90% chi phí.

Tuần này còn xuất hiện một công cụ thú vị tên Headroom — nó nằm giữa bạn và AI, tự động "nén" phần thông tin nền lại, giảm 60-95% lượng token mà chất lượng gần như không đổi. Giống như đóng gói hành lý gọn lại trước khi gửi — cùng đồ đạc, nhưng tốn ít cước hơn nhiều.

Một xu hướng lớn hơn cũng đang hình thành: thay vì thuê "bộ não khổng lồ" đắt đỏ cho mọi việc, nhiều người huấn luyện một mô hình nhỏ chuyên biệt cho đúng việc của mình — chỉ mất 1-2 giờ, rẻ hơn 90%, mà độ chính xác đạt tới một nửa so với mô hình hàng đầu. Đủ tốt cho phần lớn công việc thường ngày.

💻 3. Laptop sắp chạy được AI 120 tỷ tham số — ngay trên máy, không cần mạng

Tin này nghe kỹ thuật, nhưng hệ quả thì rất gần gũi: AI mạnh đang chuyển từ "đám mây" về thẳng chiếc máy trong túi bạn.

Tại sự kiện ở Đài Bắc, Nvidia công bố kiến trúc Vera Rubin đã vào sản xuất đầy đủ, và đáng chú ý hơn — họ hợp tác với Microsoft làm chip cho laptop Windows dùng tiến trình 3nm (cỡ nhỏ như chip Apple). Con chip này có thể chạy mô hình 120 tỷ tham số ngay trên máy, với 128GB bộ nhớ và cửa sổ ngữ cảnh 1 triệu token — tất cả tại chỗ, không cần gửi dữ liệu lên mạng.

Để dễ hình dung: trước đây muốn dùng AI mạnh, bạn phải kết nối tới máy chủ khổng lồ ở đâu đó (như gọi điện nhờ chuyên gia ở xa). Giờ thì chuyên gia đó ngồi ngay trong laptop của bạn — trả lời tức thì, không cần mạng, và dữ liệu không rời khỏi máy. Điều này đặc biệt quan trọng với ai làm việc nhạy cảm: hồ sơ khách hàng, tài liệu nội bộ không phải gửi đi đâu cả.

Nvidia so sánh chip mới với Apple M5 và khẳng định vượt trội về tốc độ xử lý AI. Tuy nhiên — và đây là điểm cần tỉnh táo — Nvidia có thói quen quảng cáo rất mạnh trước khi ra mắt, rồi sản phẩm thực tế đôi khi không như lời hứa. Phải đợi đến mùa thu khi hàng ra thị trường mới biết chắc. Nhưng hướng đi thì đã rõ: AI cá nhân, chạy tại chỗ, đang đến gần.

🛡️ 4. Sandbox bảo vệ máy — đừng để AI xóa nhầm tệp quan trọng

Khi AI ngày càng tự chủ — tự chạy lệnh, tự thao tác tệp — thì rủi ro cũng tăng. Đã có nhiều người than phiền: "AI tự ý xóa mất tệp quan trọng của tôi." Tuần này có lời giải đơn giản mà ít người biết.

Hãy hình dung bạn thuê thợ sửa nhà. Bạn cho họ vào làm, nhưng khóa riêng phòng chứa đồ quý — để lỡ có sơ suất cũng không mất gì quan trọng. Sandbox cho AI hoạt động đúng như vậy: nhốt AI trong một "phòng cách ly", cho nó làm việc thoải mái nhưng không cho đụng vào tệp hệ thống hay dữ liệu quan trọng.

Tin tốt là công cụ này miễn phí và có sẵn: trên máy Mac có lệnh sandbox-exec (đã tồn tại khoảng 25 năm), trên Linux có bubblewrap (mã nguồn mở). Cả hai đều khóa quyền truy cập của ứng dụng ở mức hệ điều hành — nghĩa là dù AI có "muốn" làm gì sai cũng không chạm tới được phần bạn đã khóa.

Anthropic cũng vừa công bố tài liệu về cách họ "giới hạn vùng ảnh hưởng" khi AI mắc lỗi — dùng container, máy ảo, môi trường cô lập để một sai sót không lan ra cả hệ thống. Bài học chung cho mọi người dùng AI: tự chủ càng cao thì rào chắn càng phải chắc. Giao chìa khóa nhà cho AI là tiện, nhưng vẫn nên có cửa phòng khóa riêng.

⚖️ 5. "Bẫy sa thải AI" — và lời cảnh báo từ chính người tạo ra nó

Phần cuối tuần này chạm tới câu hỏi lớn nhất: AI thay đổi việc làm và xã hội ra sao?

Một nghiên cứu mới mô tả thứ gọi là "bẫy sa thải AI": công ty thay người bằng AI để giảm chi phí, nhờ đó bán giá rẻ hơn, buộc đối thủ cũng phải sa thải để cạnh tranh — tạo thành một vòng xoáy. Nhưng khi quá nhiều người mất việc, sức mua của xã hội giảm xuống, và cuối cùng chính các công ty cũng thiệt vì không còn ai đủ tiền mua hàng. Các tác giả đề xuất một giải pháp khác với trợ cấp tiền mặt: thuế tự động hóa — giống thuế carbon, buộc công ty thay người bằng AI phải gánh một phần chi phí xã hội mà họ tạo ra.

Điều thú vị là cùng tuần, một nhà kinh tế hàng đầu lại công bố phân tích cho rằng "chưa có bằng chứng rõ ràng AI đang giết việc làm" dù sa thải diễn ra hàng nghìn. Hai góc nhìn trái ngược cho thấy: đây vẫn là câu hỏi mở, chưa ai có câu trả lời chắc chắn.

Trong khi đó, Ray Kurzweil — nhà dự báo công nghệ nổi tiếng — vẫn giữ dự đoán AGI (trí tuệ nhân tạo ngang con người) sẽ đến vào 2029, chỉ còn 3 năm nữa, dựa trên đà tăng trưởng theo cấp số nhân.

Và có lẽ câu đáng suy ngẫm nhất tuần đến từ Dario Amodei, người đứng đầu Anthropic — công ty tạo ra Claude: "Loài người sắp được trao một quyền lực gần như không tưởng. Và chưa rõ liệu chúng ta có đủ trưởng thành để sử dụng nó hay không." Khi chính người dẫn đầu cuộc đua cũng phải dừng lại tự hỏi như vậy, đó là tín hiệu để tất cả chúng ta cùng suy nghĩ.

🔭 Nhìn lại tuần — rẻ hơn, gần hơn, nhưng cần tỉnh hơn

Tuần này gói gọn trong nghịch lý mở đầu: mọi thứ rẻ hơn, nhanh hơn, thông minh hơn — và bằng cách nào đó, lại đắt hơn.

GLM 5.1 vượt Google. Mẹo phối mô hình tiết kiệm 90%. Laptop sắp chạy AI 120 tỷ tham số tại chỗ. Sandbox bảo vệ máy khỏi AI. Và một nghiên cứu cảnh báo về vòng xoáy sa thải.

Sợi dây xuyên suốt: AI đang đến gần hơn, rẻ hơn, mạnh hơn — và điều đó vừa là cơ hội, vừa là trách nhiệm. Cơ hội cho người biết dùng đúng cách. Trách nhiệm để không ai bị bỏ lại phía sau.

Như Dario Amodei nhắc: quyền lực lớn đang được trao tận tay. Câu hỏi không phải AI có đủ thông minh không — mà là chúng ta có đủ khôn ngoan để dùng nó cho điều đáng làm hay không.

🔚 Bản tin AI 24h hôm nay kết thúc tại đây!

Hẹn gặp bạn trong bản tin tiếp theo với những cập nhật mới nhất!

Theo dõi và phản hồi để chúng tôi ngày càng hoàn thiện bản tin cho bạn!

Tái bút: Chúng tôi làm bản tin AI này hoàn toàn miễn phí mỗi ngày. Sự ủng hộ của bạn là động lực giúp chúng tôi tiếp tục. Nếu bạn thấy hữu ích, chia sẻ cho ít nhất một, hai (hoặc 20) bạn bè của bạn nhé 😉

📚 Nguồn Tham Khảo Chính

GLM 5.1 (Zhipu), Qwen 3.7 Max, MiniMax M3: bảng xếp hạng Artificial Analysis
Mẹo phối mô hình mạnh-rẻ, Headroom (nén ngữ cảnh): GitHub
Train mô hình nhỏ chuyên biệt (Open Universal Machine Intelligence): arXiv
Nvidia Vera Rubin, chip laptop 3nm (sự kiện Đài Bắc): Nvidia
So sánh Nvidia RTX Spark vs Apple M5: Artificial Analysis
Sandbox: sandbox-exec (macOS), bubblewrap (Linux), Anthropic sandbox runtime: GitHub
"AI Layoff Trap" + thuế Pigou cho tự động hóa: arXiv
Ray Kurzweil — dự báo AGI 2029 (podcast Moonshots/Peter Diamandis): YouTube
Dario Amodei quote: Anthropic
Anthropic & SpaceX IPO filing: Bloomberg, Reuters
Suno gọi vốn $400M, định giá $5,4 tỷ: TechCrunch

Hẹn gặp lại ở bài viết sau!

Bạn muốn nghe Podcast?

🎤 Spotify: Project AI - AI 24h

🎤 Apple Podcasts : AI 24h

AI 24h | 🚀Laptop sắp chạy được AI 120 tỷ tham số

🇨🇳 1. GLM 5.1 vượt Google và OpenAI — chỉ còn xếp sau Claude

💡 2. Mẹo tiết kiệm 90%: đừng dùng giám đốc để photo tài liệu

💻 3. Laptop sắp chạy được AI 120 tỷ tham số — ngay trên máy, không cần mạng

🛡️ 4. Sandbox bảo vệ máy — đừng để AI xóa nhầm tệp quan trọng

⚖️ 5. "Bẫy sa thải AI" — và lời cảnh báo từ chính người tạo ra nó

🔭 Nhìn lại tuần — rẻ hơn, gần hơn, nhưng cần tỉnh hơn

🔚 Bản tin AI 24h hôm nay kết thúc tại đây!

📚 Nguồn Tham Khảo Chính

Bạn muốn nghe Podcast?

Reply

Keep Reading

Minh Trung AI

Home

Tác giả