AI 24h | 🚀 6 nghìn tỷ tham số bị tắt, 3 mô hình Trung Quốc bứt phá, $2,4 nghìn tỷ lên sàn

Chào bạn, Minh Trung đây! 👋

Có những tuần AI xoay quanh một sản phẩm mới. Tuần này thì ngược lại — nó xoay quanh một sản phẩm bị gỡ bỏ: Claude Fable 5, mô hình mạnh nhất từng phát hành, bị chính phủ Mỹ buộc tắt chỉ sau 4 ngày. Nhưng điều thú vị là thế giới AI không hề khựng lại. Trung Quốc tung liền ba mô hình bứt phá, một kỹ thuật ghép nhiều mô hình rẻ thành một "bộ não" thông minh hơn ra đời, cả ngành chuyển trọng tâm từ "mô hình" sang "vòng lặp tự động", và SpaceX lên sàn ở định giá $2,4 nghìn tỷ đưa Elon Musk thành nghìn tỷ phú đầu tiên.

Đi sâu vào từng chuyển động nhé.

🏛️ 1. Claude Fable 5 bị thu hồi — khi mô hình AI trở thành vấn đề an ninh quốc gia

Đây có lẽ là câu chuyện kỳ lạ nhất trong lịch sử ngành AI tới nay: một mô hình mạnh nhất từng được phát hành công khai, ra mắt rồi bị chính phủ buộc tắt chỉ sau 4 ngày — không phải vì lỗi kỹ thuật, mà vì lý do an ninh quốc gia.

Diễn biến đầy đủ:

Dòng thời gian Claude Fable 5:
├─ 09/06: Anthropic phát hành Fable 5 (mạnh nhất từng có, đứng đầu bảng coding)
├─ ~11/06: Andy Jassy (CEO Amazon) cảnh báo chính quyền — mô hình có thể bị
│          "bẻ khóa" rồi dùng để tấn công nước Mỹ
├─ Chính quyền yêu cầu Anthropic gỡ → Anthropic từ chối
│          (lý do: lỗ hổng này mô hình nào cũng có)
├─ Chính quyền ra chỉ thị kiểm soát xuất khẩu — chặn người nước ngoài
│          truy cập Fable và Muse
└─ 13/06: Anthropic quyết định TẮT TOÀN CẦU — cả người dùng Mỹ lẫn quốc tế

Vì sao phải tắt toàn cầu thay vì chỉ chặn người nước ngoài? Vì không thể lọc quốc tịch từng người dùng theo thời gian thực. Để tuân thủ chỉ thị, Anthropic buộc phải tắt hẳn cho tất cả mọi người.

Một chi tiết đáng chú ý: những khách hàng đầu tiên của Anthropic Muse — chủ yếu là cơ quan chính phủ và các tập đoàn lớn — vẫn giữ được quyền truy cập dù có lệnh này. Nói cách khác, mô hình mạnh nhất không biến mất hoàn toàn, nó chỉ rút khỏi tay công chúng và ở lại trong tay một số ít tổ chức được chọn.

Hiện Anthropic và chính quyền Trump đang đàm phán các điều kiện để mở lại một phần hoặc toàn bộ. Chưa rõ kết quả. Trong bảng xếp hạng coding mới nhất, Claude vẫn đứng đầu, nhưng dòng "Fable 5" giờ kèm chú thích: đã ngừng, đang đàm phán.

Nhận định: Sự kiện này đánh dấu một ngưỡng mới — AI đã mạnh đến mức bị quản lý như vũ khí chiến lược, không còn là phần mềm thông thường. Với người dùng, bài học rất thực tế: đừng buộc cả quy trình quan trọng vào một mô hình duy nhất, vì nó có thể biến mất sau một đêm vì lý do hoàn toàn nằm ngoài tầm kiểm soát của bạn. Và rộng hơn — khi "mô hình mạnh nhất" có thể bị tắt mà cả ngành vẫn vận hành bình thường, đó là dấu hiệu trọng tâm quyền lực đang dịch chuyển khỏi từng mô hình đơn lẻ.

🐉 2. Trung Quốc bứt phá: ba mô hình mạnh, một vòng gọi vốn khổng lồ

Trong khi mô hình mạnh nhất của Mỹ bị tắt, Trung Quốc có một tuần bùng nổ — ba mô hình ra mắt gần như cùng lúc, đều mạnh, đều rẻ, và phần lớn là mã nguồn mở.

GLM-5.2 (Zhipu AI) là tâm điểm. Rất nhiều video so sánh nó với GPT và Claude tuần này, đặc biệt ở mảng lập trình

GLM-5.2 — thông số chính: ├─ Giấy phép: MIT (mở, dễ thương mại hóa nhất) ├─ Tham số: 744 tỷ (tương đối nhỏ — kiến trúc Hỗn hợp Chuyên gia) ├─ Cửa sổ ngữ cảnh: 1 triệu token ├─ Kiến trúc index-share: tăng tốc qua tái dùng chỉ mục giữa các lớp, ít phép tính trên mỗi token → rất rẻ └─ Hiệu năng: ngang hoặc nhỉnh hơn các mô hình đóng hàng đầu ở coding & suy luận

Kimi K2.7 (Moonshot AI) là mô hình mã nguồn mở chuyên về lập trình — đi đúng hướng Anthropic đang đi:

Hạng mục	Kimi K2.7	Ghi chú
Tổng tham số	1 nghìn tỷ	32 tỷ hoạt động mỗi lượt
Kiểu	Open-weight (tải về dùng tự do)	Chạy qua Ollama
Thế mạnh	Tệp dài, kho mã nhiều tệp, quy trình agent	Tải trên Hugging Face
Sản phẩm kèm	Kimi Work	"Nhân viên AI" chạy trên máy bàn

DeepSeek gọi vốn $7,4 tỷ ở định giá hơn $50 tỷ — trở thành startup AI giá trị nhất Trung Quốc. Điểm đáng chú ý: nhà sáng lập Liang Wenfeng (trước quản lý một quỹ đầu cơ) tự bỏ ra khoảng $3 tỷ trong số $7,4 tỷ — tức một người góp gần nửa vòng vốn. Một quỹ nhà nước chỉ tham gia $150 triệu, phần rất nhỏ.

Một điểm thực tế quan trọng với các đội kỹ thuật ở Việt Nam: phía Mỹ có danh sách đen các công ty Trung Quốc mà chính phủ không được dùng (Alibaba và vài cái tên đã bị thêm vào — đáng tiếc, vì mô hình của họ rất tốt). Nhưng DeepSeek hiện chưa bị đưa vào danh sách, nên vẫn dùng được.

Nhận định: Khoảng cách Mỹ–Trung trong AI đang thu hẹp rõ rệt, và chiến lược của hai bên ngày càng khác nhau. Mỹ siết chặt (kiểm soát xuất khẩu, danh sách đen). Trung Quốc mở rộng (mã nguồn mở, giấy phép MIT dễ thương mại). Nghịch lý: chính sách càng siết, mô hình mở của Trung Quốc càng hấp dẫn với phần còn lại của thế giới — gồm cả các đội ở Việt Nam đang tìm giải pháp tốt mà chi phí thấp.

🔀 3. OpenRouter Fusion — khi nhiều mô hình rẻ ghép lại thông minh hơn một mô hình đắt

Đây là một trong những ý tưởng thú vị nhất tuần, và nó báo hiệu một chuyển dịch lớn: từ chỗ chọn một mô hình tốt nhất, sang chỗ ghép nhiều mô hình lại thành một hệ thống.

Ý tưởng của OpenRouter Fusion rất đơn giản nhưng hiệu quả: khi bạn đặt một câu hỏi, thay vì gửi cho một mô hình, nó gửi đồng thời cho nhiều mô hình rẻ, rồi tổng hợp các câu trả lời thành một câu trả lời tốt nhất.

Cách Fusion hoạt động:
   Câu hỏi của bạn
        │
        ├──→ Gemini 3 Flash (Google, rẻ)
        ├──→ Kimi K2.6 (Trung Quốc, rẻ)
        └──→ DeepSeek V4 Pro (Trung Quốc, rẻ)
                  │
                  ▼
        Tổng hợp thành 1 câu trả lời
        → giảm sai sót, chính xác hơn, mà vẫn rẻ hơn dùng Claude

Vì sao ghép lại thì tốt hơn? Khi nhiều mô hình cùng trả lời và hệ thống chọn lọc theo điểm đồng thuận, những chỗ một mô hình "đoán bừa" sẽ bị các mô hình khác phản biện — kết quả là giảm sai sót và đáng tin hơn. Mà vì toàn dùng mô hình rẻ, tổng chi phí vẫn thấp hơn một mô hình cao cấp.

Một sản phẩm tương tự là Perplexity Computer ($200/tháng): nó dùng được tới 19 mô hình và kết hợp đầu ra của chúng, với Claude Opus đóng vai "giám khảo" chấm điểm để nâng chất lượng câu trả lời cuối.

Cách tiếp cận	Logic	Lợi ích
Truyền thống	Chọn 1 mô hình tốt nhất	Đơn giản, nhưng phụ thuộc 1 nguồn
Fusion (ghép)	Nhiều mô hình rẻ → tổng hợp	Giảm sai sót, chính xác cao, chi phí thấp
Perplexity Computer	19 mô hình + Claude làm giám khảo	Chất lượng cao, điều phối theo tác vụ

Điều thú vị: bạn hoàn toàn có thể tự làm phiên bản này tại chỗ — viết một đoạn mã điều khiển nhỏ, gọi vài mô hình nhỏ chạy nội bộ, rồi gộp đầu ra thành "một mô hình". Một dự án cuối tuần rất đáng thử cho ai mê kỹ thuật.

Nhận định: Fusion là minh chứng rõ nhất cho câu "khung quan trọng hơn mô hình". Bạn không cần mô hình mạnh nhất hay đắt nhất — bạn cần cách phối hợp đúng nhiều mô hình bình thường. Đây là tin tốt cho túi tiền: chất lượng cao không còn đồng nghĩa với chi phí cao.

🔄 4. Kỹ nghệ vòng lặp — khi "mô hình" không còn là tất cả

Nếu phải chọn một chuyển dịch tư duy lớn nhất tuần này, thì đó là sự dịch chuyển từ "mô hình" sang "mô hình + harness + bộ nhớ + quản lý phiên bản". Nghe kỹ thuật, nhưng cốt lõi rất dễ hiểu.

Hãy nhớ những chatbot đầu tiên (như GPT-3.5): bạn hỏi → nó trả lời, một lần, hết. Nó chỉ đoán từ tiếp theo. Còn AI bây giờ hoạt động khác hẳn — bên trong có một vòng lặp:

Vòng lặp (loop) bên trong AI hiện đại:
   Nhận yêu cầu → hiểu → lập kế hoạch từng bước
        → bắt đầu trả lời → tự kiểm tra đúng/sai
        → cải thiện → lặp lại đến khi hoàn thành mục tiêu
   (AI tự "ra lệnh" cho chính nó — không cần bạn nhắc từng bước)

Đây gọi là "kỹ nghệ vòng lặp" (loop engineering) — một mô hình tư duy mới đang phổ biến. Thay vì soạn từng câu lệnh thủ công, người ta thiết kế các vòng lặp tự động dẫn dắt agent theo đuổi một mục tiêu đến khi xong. Vòng lặp có thể kích hoạt theo lịch, theo thời điểm, hoặc theo sự kiện.

Cả vòng đời của một agent giờ được nhìn thành 4 lớp:

Lớp	Nội dung
Vai trò & mục tiêu	Xác định "nhân cách", mục tiêu cốt lõi, phạm vi, quyền hạn
Kiến trúc & logic	Lập kế hoạch, thiết kế vòng lặp điều khiển, quản lý trạng thái
Hạ tầng & năng lực	Câu lệnh, công cụ/harness, hệ thống bộ nhớ
Chất lượng & vận hành	Kiểm chứng (AI tự chấm), an toàn, rào chắn, khả năng giám sát

Phần "bộ nhớ" đặc biệt quan trọng. Một bài viết được chia sẻ nhiều tuần này chỉ ra: RAG cơ bản (chỉ tìm và lấy thông tin) không đủ để agent có sự liên tục thật. Agent thực thụ cần một hệ thống trí nhớ có cấu trúc với 5 loại: chính sách, sở thích, sự kiện, hồi ức, và dấu vết. Quan trọng nhất: trí nhớ bền phải nằm trong một cơ sở dữ liệu thật, không phải gom hết vào một chỗ.

Nhận định: Đây là sự trưởng thành của ngành. Năm ngoái ai cũng hỏi "mô hình nào mạnh nhất?". Năm nay câu hỏi đúng là "vòng lặp, bộ nhớ và cách điều khiển của tôi đã tốt chưa?". Với dân văn phòng, bài học đơn giản: khi AI làm chưa tốt, đừng vội đổi mô hình — hãy xem lại cách bạn giao việc, lưu bối cảnh, và để nó tự kiểm tra. Đó mới là nơi tạo ra khác biệt.

❝

🎁 Tặng bạn: Bộ 6 prompt "Tư duy Vòng lặp" cho dân văn phòng (PDF)

Bản tin tuần này nói về "kỹ nghệ vòng lặp" — xu hướng để AI tự lập kế hoạch, tự kiểm tra, tự sửa đến khi xong. Nhưng đó là thứ chạy ở tầng hệ thống, cần lập trình.

Vậy người không biết code thì sao? Bạn vẫn mượn được tư duy đó để ra lệnh cho AI tốt hơn ngay trong chat. File này gói thành 6 mẫu prompt sao chép-dán-dùng ngay: viết email, lập kế hoạch, phân tích tài liệu, soạn nội dung nhiều phiên bản, và hơn thế.

Kèm khung V-K-T-D (Vai trò – Kế hoạch – Tự kiểm tra – Dừng) để bạn tự viết prompt vòng lặp cho bất kỳ việc gì. AI tự chấm chính nó có thể chủ quan, nên bạn vẫn là người kiểm tra cuối nhé.

📥 Tải miễn phí bên dưới.

AI24h-huong-dan-vong-lap.pdf

5.26 MB • PDF File

🚀 5. SpaceX lên sàn $2,4 nghìn tỷ, mua Cursor $60 tỷ — và bản đồ quyền lực AI vẽ lại

Tuần này khép lại bằng những ván cờ tài chính định hình lại cả ngành.

SpaceX lên sàn ở định giá $2,4 nghìn tỷ. Giá cổ phiếu lên rồi xuống nhẹ, nhưng Elon Musk đạt được điều ông muốn: công ty huy động được lượng tiền khổng lồ, và ông trở thành nghìn tỷ phú đầu tiên trong lịch sử. SpaceX hiện giao dịch trên sàn NASDAQ với mã SPCX.

Nhiều người chỉ trích Musk chạy theo tiền, nhưng có một góc nhìn đáng cân nhắc: nhà đầu tư Peter Diamandis — người biết Musk từ trước khi ông giàu — kể lại rằng khi Musk làm những tên lửa đầu tiên, mọi thứ đều nổ tung. Ông đổ hết tiền vào và mất sạch. Chỉ đến tên lửa thứ tư, cũng là lần cuối còn đủ tiền, mới thành công — và từ đó mới có sự hậu thuẫn của NASA. Một lời nhắc: đằng sau những con số nghìn tỷ là rủi ro rất thật.

Ngay sau khi lên sàn, SpaceX mua lại Cursor với giá $60 tỷ bằng quyền chọn cổ phiếu. Cursor là trình soạn thảo lập trình ưu tiên AI nổi tiếng (ban đầu là một nhánh tách ra từ Visual Studio Code). Đây là thương vụ khổng lồ, được dàn xếp từ trước cả khi IPO diễn ra.

Và một cách gọi mới đang lan truyền, cho thấy bản đồ quyền lực công nghệ đã đổi.

Bản đồ quyền lực công nghệ thay đổi:

   FAANG (cũ)              →    MANGOS (mới)
   ├─ Facebook                  ├─ Meta
   ├─ Amazon                    ├─ Anthropic
   ├─ Apple                     ├─ Nvidia
   ├─ Netflix                   ├─ Google
   └─ Google                    ├─ OpenAI
                                └─ SpaceX

Sự xuất hiện của Anthropic, Nvidia, OpenAI và SpaceX trong nhóm dẫn đầu — thay cho Apple và Netflix — cho thấy giá trị đang dồn về hạ tầng AI và không gian, thay vì phần cứng tiêu dùng và giải trí.

Nhận định: Tiền và quyền lực đang tập trung vào một nhóm rất nhỏ các công ty xây nền tảng AI. Với người làm kinh doanh ở Việt Nam, điều này có nghĩa là nền tảng bạn xây dựng trên đó (Claude, Gemini, các mô hình mở) sẽ ngày càng do một số ít ông lớn định đoạt — nên đa dạng hóa nhà cung cấp và ưu tiên các giải pháp mở là chiến lược phòng thủ khôn ngoan.

🔭 Nhìn lại tuần — khi nhiều nền tảng dịch chuyển cùng lúc

Năm chuyển động tuần này có một sợi dây chung: trọng tâm của ngành AI đang dịch khỏi từng mô hình đơn lẻ.

Mô hình mạnh nhất (Fable 5) bị tắt mà thế giới vẫn chạy. Trung Quốc tung ba mô hình mở để ai cũng dùng được. Fusion ghép nhiều mô hình rẻ thành một bộ não thông minh hơn. Cả ngành chuyển sang "kỹ nghệ vòng lặp" — nơi cách điều khiển và bộ nhớ quan trọng hơn mô hình. Và quyền lực tài chính dồn về một nhóm nhỏ xây nền tảng. Tất cả đều nói cùng một điều: mô hình chỉ là một mảnh — hệ thống mới là tất cả.

Vài tin bổ sung đáng chú ý tuần này:

Tin tốt cho dev: Anthropic hoãn việc đổi cách tính phí Claude Agent SDK — nghĩa là vẫn dùng được qua gói thuê bao ($20/$100/$200), chưa bị tính theo token đắt đỏ. Tin nhẹ nhõm cho ai đang xây ứng dụng.
TCS (Tata) đưa 50.000 nhân viên dùng Claude — công ty tư vấn Ấn Độ với 400.000 người hợp tác lớn với Anthropic.
Paper "Từ AGI đến ASI" của Google DeepMind — bắt đầu nghĩ về điều xảy ra sau khi đạt AGI: hàng triệu agent phối hợp tức thời, vượt các đội người giỏi nhất. Câu hỏi mở lớn nhất: liệu AI có thể tạo ra ý tưởng thực sự mới, hay chỉ trộn lại kiến thức cũ?
Amazon sắp bán chip Trainium cho bên thứ ba — Claude vốn chạy trên chip Trainium của Amazon (không phải Nvidia). Giờ Amazon bán ra ngoài, trở thành đối thủ trực tiếp của Nvidia.
DeepSeek V4 + Claude Code: rẻ hơn 5-10 lần — dùng Claude Opus điều phối, DeepSeek lo phần việc đơn giản, trong cùng một phiên làm việc.
Midjourney "siêu âm toàn thân" — máy quét siêu âm cả người, rẻ hơn chụp cộng hưởng từ 10 lần, nhanh hơn 60 lần, độ phân giải dưới một milimet. Dùng AI để xử lý ảnh.

Nhìn rộng ra: tháng 6 này số vụ sa thải không nhiều. Nhưng thông điệp xuyên suốt vẫn rõ — trong một thế giới mà mô hình mạnh nhất có thể bị tắt sau một đêm, giá trị bền vững không nằm ở việc bám vào một công cụ, mà ở khả năng dựng một hệ thống linh hoạt: nhiều mô hình, bộ nhớ tốt, vòng lặp thông minh, và phương án dự phòng.

🔚 Bản tin AI 24h hôm nay kết thúc tại đây!

Hẹn gặp bạn trong bản tin tiếp theo với những cập nhật mới nhất!

Theo dõi và phản hồi để chúng tôi ngày càng hoàn thiện bản tin cho bạn!

Tái bút: Chúng tôi làm bản tin AI này hoàn toàn miễn phí mỗi ngày. Sự ủng hộ của bạn là động lực giúp chúng tôi tiếp tục. Nếu bạn thấy hữu ích, chia sẻ cho ít nhất một, hai (hoặc 20) bạn bè của bạn nhé 😉

📚 Nguồn Tham Khảo Chính

Claude Fable 5 bị thu hồi, đàm phán Mỹ–Anthropic, chỉ thị kiểm soát xuất khẩu: Bloomberg, TechCrunch, gHacks (12–13/06/2026)
GLM-5.2 (Zhipu AI, giấy phép MIT, 744 tỷ tham số): Zhipu AI
Kimi K2.7 & Kimi Work (Moonshot AI, open-weight): Hugging Face
DeepSeek gọi vốn $7,4 tỷ ở định giá $50 tỷ+: Bloomberg, Reuters
OpenRouter Fusion (mô hình tổ hợp): OpenRouter
Perplexity Computer (19 mô hình, Claude làm giám khảo) & Perplexity Brain Memory: Perplexity
Kỹ nghệ vòng lặp / Agent Engineering (Matthew Berman, loop library): signals.forwardfuture.ai
"Từ RAG đến Hệ thống trí nhớ" (5 loại bộ nhớ): bài phân tích chuyên ngành
SpaceX IPO $2,4 nghìn tỷ (NASDAQ: SPCX), mua Cursor $60 tỷ: Bloomberg, CNBC
FAANG → MANGOS: Bài giảng AI Updates
Anthropic hoãn đổi billing Claude Agent SDK: Anthropic docs
TCS 50K dùng Claude · Paper "AGI to ASI" (Google DeepMind) · Amazon bán chip Trainium · Midjourney siêu âm: Bài giảng AI Updates

Hẹn gặp lại ở bài viết sau!

Bạn muốn nghe Podcast?

🎤 Spotify: Project AI - AI 24h

🎤 Apple Podcasts : AI 24h

AI 24h | 🚀 6 nghìn tỷ tham số bị tắt, 3 mô hình Trung Quốc bứt phá, $2,4 nghìn tỷ lên sàn

🏛️ 1. Claude Fable 5 bị thu hồi — khi mô hình AI trở thành vấn đề an ninh quốc gia

🐉 2. Trung Quốc bứt phá: ba mô hình mạnh, một vòng gọi vốn khổng lồ

🔀 3. OpenRouter Fusion — khi nhiều mô hình rẻ ghép lại thông minh hơn một mô hình đắt

🔄 4. Kỹ nghệ vòng lặp — khi "mô hình" không còn là tất cả

🚀 5. SpaceX lên sàn $2,4 nghìn tỷ, mua Cursor $60 tỷ — và bản đồ quyền lực AI vẽ lại

🔭 Nhìn lại tuần — khi nhiều nền tảng dịch chuyển cùng lúc

🔚 Bản tin AI 24h hôm nay kết thúc tại đây!

📚 Nguồn Tham Khảo Chính

Bạn muốn nghe Podcast?

Reply

Keep Reading

Minh Trung AI

Home

Tác giả