
Chào bạn, Minh Trung đây! 👋
Tuần này, ngành AI có hai mặt đối lập rõ rệt. Một bên là chính phủ Mỹ siết chặt: Claude Fable 5 vẫn chưa trở lại, và đến lượt OpenAI bị chặn phát hành GPT-5.6. Bên kia là cộng đồng tăng tốc: một làn sóng mới gọi là "kỹ nghệ harness" đang chứng minh có thể cho kết quả tốt hơn 6 lần mà không cần đổi mô hình, token rẻ đi cả nghìn lần, và những kiến trúc agent mới mọc lên mỗi tuần.
Điểm chung của tất cả: trọng tâm đã rời khỏi "mô hình mạnh nhất" và chuyển sang cách bạn dùng nó. Đi sâu vào từng chuyển động nhé.
🏛️ 1. Chính phủ Mỹ chặn hai siêu AI — kiểm soát thay cho tốc độ

Câu chuyện lớn nhất tuần này là sự can thiệp ngày càng mạnh của chính phủ Mỹ vào các mô hình AI hàng đầu — một xu hướng tiếp nối vụ Claude Fable 5 bị tắt tuần trước.
Tình hình kiểm soát AI của chính phủ Mỹ:
├─ Claude Fable 5: VẪN OFFLINE — chưa rõ khi nào trở lại
│ (có thể vài tuần, thậm chí vài tháng)
├─ OpenAI GPT-5.6: BỊ CHẶN phát hành công khai
│ (chính phủ yêu cầu "ưu tiên an ninh trước")
└─ Cách phát hành mới: chỉ giao cho "đối tác tin cậy", từng bên một,
và chỉ khi chính phủ phê duyệtĐáng chú ý nhất là một lệnh hành pháp mới: chính quyền Trump yêu cầu các công ty cho chính phủ liên bang quyền truy cập sớm tới 30 ngày với các mô hình mạnh nhất trước khi ra công chúng. Nói cách khác, chính phủ muốn nắm quyền kiểm soát và chủ động làm chậm lại tốc độ phát hành.
Trên bảng xếp hạng, bộ ba dẫn đầu hiện là GLM 5.2 (Trung Quốc), Opus 4.8, và GPT 5.5. Nhiều người thích GLM 5.2, nhưng ở mảng lập trình, Claude vẫn áp đảo tuyệt đối.
Mô hình | Xuất xứ | Ghi chú |
|---|---|---|
Opus 4.8 | Anthropic (Mỹ) | Vẫn nhỉnh hơn ở lập trình & tác vụ khó |
GLM 5.2 | Z.AI (Trung Quốc) | Mã nguồn mở, chất lượng cao, miễn phí |
GPT 5.5 | OpenAI (Mỹ) | Mạnh, nhưng bản 5.6 đang bị chặn |
Nhận định: Đây là một ngưỡng chính sách mới — AI mạnh giờ được quản lý như công nghệ chiến lược quốc gia, không còn là sản phẩm thương mại tự do. Với người dùng, có một nghịch lý đáng lưu ý: chính sách càng siết các mô hình Mỹ, mô hình mã nguồn mở của Trung Quốc như GLM 5.2 lại càng hấp dẫn — vì nó luôn sẵn có, miễn phí, không phụ thuộc lệnh cấm. Đa dạng hóa nhà cung cấp không còn là lựa chọn, mà là điều bắt buộc.
🎯 Làm gì ngay: Liệt kê những công việc bạn đang phụ thuộc một công cụ AI duy nhất. Với mỗi việc, thử tìm một phương án thay thế (một mô hình khác, một công cụ mở) và lưu lại — để nếu công cụ chính "biến mất sau một đêm", bạn không bị gián đoạn.
🔧 2. "Kỹ nghệ harness" — cơn sốt vàng mới của ngành AI

Nếu tuần trước chúng ta nói "yên cương quan trọng hơn con ngựa", thì tuần này điều đó đã thành một cơn sốt vàng thực sự. Khi các mô hình ngày càng ngang nhau về chất lượng, thứ tạo ra khác biệt không còn là mô hình — mà là harness (cách bạn trang bị, điều khiển và cung cấp công cụ cho nó).
Con số gây sốc nhất tuần này:
Điều này khởi sinh cả một ngành mới. Người ta giờ xây dựng "Hệ điều hành Agent" (Agentic OS) — đóng gói đầy đủ skill, tự động hóa, bộ nhớ, giao diện, và cách phân phối — rồi bán cho khách hàng. Để phục vụ nhiều khách mà không phải bảo trì hàng chục bản sao, người ta thiết kế agent theo 3 lớp như một hệ điều hành thật:
Lớp | Vai trò | Ví dụ dễ hiểu |
|---|---|---|
Nhân (lõi) | Phần chạy cốt lõi, ổn định, dùng chung mọi khách | "Hệ điều hành" gốc |
Plugin chung | Công cụ, kỹ năng tải thêm khi cần | "Ứng dụng" cài thêm |
Cấu hình riêng | Tùy chỉnh cho từng khách hàng cụ thể | "Cài đặt cá nhân" |
Một công cụ thú vị khác là "Fable Brain Prompting": Anthropic công bố bộ quy tắc điều khiển hành vi của Fable, và bạn có thể mượn chính bộ quy tắc đó để mô hình thường hành xử giống mô hình tốt nhất. Mười quy tắc gồm: hành động chứ đừng lập kế hoạch quá mức, dẫn dắt bằng kết quả, có căn cứ cho mọi tuyên bố, kiểm tra lại bài làm của mình... (Trung tặng bạn trọn bộ 10 quy tắc ở cuối bản tin.)
Nhận định: Đây là cơ hội thực sự cho người Việt. Bạn không cần xây mô hình tỷ đô — bạn chỉ cần giỏi "đóng yên cương": biết cách cung cấp đúng công cụ, đúng bối cảnh, đúng quy trình cho một mô hình có sẵn. Một người khéo dùng harness với mô hình mã nguồn mở miễn phí có thể tạo ra kết quả vượt một người dùng vụng về với mô hình đắt tiền nhất. Lưu ý cân bằng: harness và prompt giỏi tới đâu cũng không thay được phán đoán — nếu bạn giao một nhiệm vụ sai từ gốc, mô hình vẫn sẽ trả lời tự tin nhưng sai.
🎯 Làm gì ngay: Lần tới khi AI cho kết quả chưa tốt, đừng vội đổi công cụ. Thử ba việc: (1) cung cấp thêm bối cảnh/tài liệu nền, (2) chia việc thành các bước nhỏ rõ ràng, (3) yêu cầu nó tự kiểm tra lại. Đó chính là "đóng yên cương" — và thường cải thiện kết quả ngay mà không tốn thêm xu nào.
🧠 3. Kiến trúc agent mới — "bộ não đặt vào giữa"

Tuần này xuất hiện một cách nghĩ rất hay về việc xây dựng ứng dụng: thay vì lập trình phần mềm phức tạp ở giữa, đặt thẳng một agent (bộ não AI) vào đó.
Hãy hình dung một phần mềm thông thường: có đầu vào, có một loạt chức năng và giao diện ở giữa, rồi cho ra kết quả (báo cáo, quyết định, hành động). Ý tưởng "Agent-Centered App" là: vứt bỏ toàn bộ phần phức tạp ở giữa, thay bằng một agent — rồi tùy biến nó bằng các "skill". Cách này tạo ứng dụng dễ hơn nhiều so với viết phần mềm riêng.
Khi cần sức mạnh lớn, người ta dùng Agent Map-Reduce — một kiến trúc đa agent:
Agent Map-Reduce (nhạc trưởng & dàn nhạc):
Agent điều phối (nhạc trưởng)
│ chia nhỏ và giao việc
├──→ Sub-agent 1 ──┐
├──→ Sub-agent 2 ──┤ (làm song song)
├──→ Sub-agent 3 ──┤
└──→ ... (tới hàng trăm/nghìn agent)
│
Gộp kết quả về → câu trả lời cuốiThú vị là ý tưởng này không mới — nó bắt nguồn từ cách Google tìm kiếm, rồi Hadoop và Spark xử lý dữ liệu lớn, giờ được dùng cho hệ thống nhiều agent. Một số tên gọi: LLM MapReduce, agentic MapReduce.
Hai công cụ đáng chú ý cùng hướng này:
Sakana AI Fugu — điều phối nhiều mô hình qua một cổng duy nhất, hành xử như một mô hình mạnh đơn lẻ nhưng thực chất là lớp điều phối (giống ý tưởng Fusion tuần trước). Hiệu năng sánh ngang Claude Fable trên vài bài kiểm tra.
Hermes "/learn" — bạn gõ "learn" kèm nguồn (đường dẫn, tệp, lịch sử chat), agent sẽ tự tạo ra một skill từ đó. Ví dụ: "học cách tôi vừa triển khai máy chủ thử nghiệm" → nó tạo skill "triển khai staging" để lần sau dùng lại.
Nhận định: Điểm chung của mọi kiến trúc tuần này là agent không còn làm việc một mình. Cách tạo giá trị giờ là phối hợp nhiều agent, mỗi cái một việc, và để chúng tự học kỹ năng mới. Với doanh nghiệp Việt, đây là tin tốt: bạn có thể bắt đầu nhỏ — một agent điều phối vài agent phụ cho một quy trình cụ thể (chăm sóc khách hàng, xử lý đơn, tổng hợp báo cáo) — thay vì mơ một hệ thống khổng lồ ngay từ đầu.
🎯 Làm gì ngay: Chọn một quy trình lặp đi lặp lại trong công việc của bạn (ví dụ: tổng hợp phản hồi khách hàng hàng tuần). Thử chia nó thành 2-3 bước nhỏ và giao từng bước cho AI như những "trợ lý phụ" — một cái thu thập, một cái phân loại, một cái viết tóm tắt. Bạn đóng vai "nhạc trưởng" ghép kết quả lại.
🔬 4. Cách bắt AI ngừng "nói sai" — và cách nhân viên Anthropic dùng skill

Phần này thực dụng nhất tuần — áp dụng được ngay để AI cho kết quả đáng tin hơn.
Chính đội ngũ Anthropic chia sẻ cách họ khiến AI ngừng đưa thông tin sai. Điều quan trọng: nó không tự xảy ra, bạn phải chủ động làm:
5 cách khiến AI đáng tin hơn (từ đội Anthropic):
1. Nói cụ thể → yêu cầu rõ ràng, không mơ hồ
2. Một nguồn sự thật → tạo một tài liệu gốc duy nhất để AI bám vào
3. Đòi bằng chứng → bắt AI dẫn nguồn cho mỗi tuyên bố
4. Lấy ý kiến thứ 2 → hỏi một mô hình khác để đối chiếu
5. Thử trước khi tự động → kiểm tra kỹ trước khi giao việc tự chạyAnthropic cũng tiết lộ cách nhân viên họ dùng "Claude Skills" — những thư mục có cấu trúc gồm script, tài liệu, công cụ. Họ chia skill thành 4 loại:
Loại skill | Công dụng |
|---|---|
Tiện ích (Utility) | Làm một tác vụ cụ thể |
Kiểm chứng (Verification) | Kiểm tra chất lượng |
Bổ sung dữ liệu (Data enrichment) | Lấy thông tin từ bên ngoài |
Điều phối (Orchestration) | Nối nhiều bước lại với nhau |
Một đột phá kỹ thuật đáng nhắc: SubQ (sub-quadratic) — mô hình xử lý ngữ cảnh 12 triệu token, nhanh và rẻ hơn nhiều so với mô hình hàng đầu, hợp cho phân tích tài liệu rất lớn và agent lập trình. (Để dễ hình dung, 12 triệu token đủ chứa cả một tủ sách.)
Nhận định: Bài học cốt lõi rất hợp với dân văn phòng: AI đáng tin không phải mặc định — bạn phải thiết kế cho nó đáng tin. Ba mẹo dễ áp dụng nhất ngay hôm nay: nói cụ thể, bắt AI dẫn nguồn, và luôn rà lại bằng mắt mình trước khi dùng cho việc quan trọng. Đây cũng là tinh thần xuyên suốt: con người vẫn là người kiểm tra cuối.
🎯 Làm gì ngay: Thêm một câu vào cuối mọi câu lệnh quan trọng: "Với mỗi thông tin, hãy dẫn nguồn; nếu không chắc, ghi rõ 'cần xác minh' thay vì đoán." Chỉ một câu này thôi đã lọc bớt phần lớn lỗi sai mà AI hay mắc.
🚀 5. "Sóng thần siêu thanh": token rẻ đi 1.000 lần, và dòng tiền đổ vào hạ tầng

Khép lại tuần bằng một góc nhìn toàn cảnh và những dòng tiền lớn định hình hạ tầng AI.
Nhà tương lai học Peter Diamandis gọi tốc độ tiến bộ hiện nay là "sóng thần siêu thanh", với những con số đáng kinh ngạc:
Tốc độ tiến bộ AI (theo Diamandis):
├─ Giá token: giảm ~1.000 LẦN chỉ trong vài năm
├─ Quy mô mô hình: 175 tỷ tham số (2020) → nhiều nghìn tỷ (nay)
│ (Opus ước tính ~5 nghìn tỷ tham số)
├─ GDP toàn cầu: AI có thể đẩy từ hàng chục nghìn tỷ
│ lên hàng trăm nghìn tỷ đô
└─ Y học: nén hàng thập kỷ khám phá thuốc xuống 5-10 nămĐiều ít người nhận ra: giá ngày càng rẻ trong khi năng lực ngày càng mạnh — một sự kết hợp hiếm có. Cũng xuất hiện một "chỉ số giá token" (Orin) theo dõi chi phí suy luận AI, coi trí tuệ như một loại hàng hóa giống dầu mỏ.
Dòng tiền tuần này dồn mạnh vào hạ tầng — phần "đường ray" để chạy AI:
Thương vụ | Quy mô | Ý nghĩa |
|---|---|---|
Reflection AI thuê trung tâm dữ liệu SpaceX | $6,3 tỷ ($150 triệu/tháng) | AI và không gian ngày càng gắn nhau |
Groq gọi vốn | $650 triệu | Chuyển từ làm chip sang đám mây suy luận |
Baseten gọi vốn | $1,5 tỷ | Hạ tầng linh hoạt, ~60 người, tăng rất nhanh |
Anthropic cũng lập "Claude Corps Fellowship" — chương trình một năm tài trợ đưa người trẻ vào các tổ chức phi lợi nhuận để giúp họ ứng dụng AI.
Nhận định: Hai mặt cần nhìn cùng lúc. Mặt sáng: token rẻ đi 1.000 lần nghĩa là AI mạnh đang trở nên rẻ đến mức ai cũng với tới được — cơ hội khổng lồ cho cá nhân và doanh nghiệp nhỏ ở Việt Nam. Mặt cần tỉnh táo: phần lớn tiền và quyền lực đang dồn về một nhóm rất nhỏ các công ty xây hạ tầng, nên giá trị thật sự bạn tạo ra không nằm ở việc sở hữu hạ tầng, mà ở việc ứng dụng AI khéo léo vào đúng bài toán của mình.
🎯 Làm gì ngay: Vì AI giờ rất rẻ, hãy mạnh dạn thử nghiệm. Chọn một việc tốn thời gian trong tuần (soạn báo cáo, trả lời email mẫu, tóm tắt tài liệu) và để AI làm thử — chi phí gần như bằng không, nhưng thời gian tiết kiệm được có thể đáng kể. Bắt đầu nhỏ, đo kết quả, rồi nhân rộng.
🔭 Nhìn lại tuần — kẻ thắng là người "đóng yên cương" giỏi nhất
Năm chuyển động tuần này hội tụ về một thông điệp: khi mọi mô hình đều mạnh, kẻ thắng không phải người có mô hình mạnh nhất — mà người biết dùng nó khéo nhất.
Chính phủ chặn hai siêu AI mạnh nhất. Harness tốt cho kết quả hơn 6 lần mà không đổi mô hình. Agent giờ phối hợp theo đội thay vì làm một mình. AI đáng tin phải được thiết kế chứ không tự có. Và token rẻ đi 1.000 lần đưa AI mạnh tới tầm tay mọi người. Tất cả nói cùng một điều: lợi thế cạnh tranh đã dịch từ "sở hữu mô hình" sang "biết cách dùng".
Vài tin bổ sung đáng chú ý tuần này:
Bài học Jack Ma & Alibaba: Alibaba bị thêm vào danh sách đen của Mỹ (do bị nhà nước Trung Quốc kiểm soát). Nhìn lại 2020: Jack Ma phê bình hệ thống tài chính → bị chặn IPO khổng lồ, phạt $2,8 tỷ, tài sản bốc hơi một nửa (từ hơn $60 tỷ xuống ~$30 tỷ). Bài học: nhà đầu tư mất niềm tin khi nhà nước can thiệp sâu vào doanh nghiệp.
GLM 5.2 vs Anthropic (thực chiến): dùng zCode (bản Claude Code của Z.AI) chạy GLM 5.2, có vài tác vụ nó không giải được mà Claude Code giải ngay. "Anthropic vẫn là vua" — nhưng GLM 5.2 vẫn rất đáng dùng và hoàn toàn miễn phí.
Seedance 2.5 (ByteDance): mô hình video AI mới, xuất 4K khoảng 30 giây.
SQLite viết lại bằng Rust: không phải AI, nhưng quan trọng — một nền tảng lưu trữ dữ liệu cực phổ biến được làm mới.
Nghìn tỷ cảm biến (2030): Diamandis dự báo hàng chục tỷ thiết bị, nghìn tỷ cảm biến → "thế giới minh bạch tuyệt đối", kèm lo ngại lớn về quyền riêng tư.
Tổng kết: tháng 6 này số vụ sa thải ít hơn hẳn tháng 5 — một tín hiệu nhẹ nhõm. Nhưng thông điệp lớn vẫn rõ: trong một thế giới mà mô hình mạnh nhất có thể bị chặn bất cứ lúc nào và token rẻ đi mỗi tháng, người trụ vững không phải người bám vào một công cụ, mà người biết đóng yên cương — linh hoạt phối hợp nhiều mô hình, thiết kế quy trình đáng tin, và ứng dụng đúng vào bài toán của mình.
【🎁 Quà tặng tuần này: 10 quy tắc "Fable Brain Prompting"】
Tuần này nói nhiều về việc "mượn bộ não của mô hình tốt nhất". Anthropic đã công bố bộ quy tắc điều khiển hành vi của Fable — và bạn có thể áp dụng chính 10 quy tắc đó để mô hình thường (kể cả bản miễn phí) hành xử giống mô hình hàng đầu. Trung gói thành PDF tiếng Việt, mỗi quy tắc kèm ví dụ và câu mẫu dùng ngay.
📥 Tải miễn phí bên dưới.
🔚 Bản tin AI 24h hôm nay kết thúc tại đây!
Hẹn gặp bạn trong bản tin tiếp theo với những cập nhật mới nhất!
Theo dõi và phản hồi để chúng tôi ngày càng hoàn thiện bản tin cho bạn!
Tái bút: Chúng tôi làm bản tin AI này hoàn toàn miễn phí mỗi ngày. Sự ủng hộ của bạn là động lực giúp chúng tôi tiếp tục. Nếu bạn thấy hữu ích, chia sẻ cho ít nhất một, hai (hoặc 20) bạn bè của bạn nhé 😉
📚 Nguồn Tham Khảo Chính
Chính phủ Mỹ hoãn GPT-5.6, lệnh truy cập sớm 30 ngày, Fable 5 vẫn offline: Bloomberg, Reuters
Bộ ba GLM 5.2 / Opus 4.8 / GPT 5.5 & LM Arena: LM Arena
Harness Engineering (tốt hơn 6 lần), Agentic OS, 3 lớp agent: phân tích ngành
Fable Brain Prompting (10 quy tắc): tài liệu nhà phát triển Anthropic
Agent-Centered App, Agent Map-Reduce, Sakana AI Fugu, Hermes "/learn": Bài giảng AI Updates
"Cách bắt AI ngừng nói sai" & Claude Skills (4 loại): đội ngũ Anthropic
SubQ (12 triệu token, subq.ai): Sub Quadratic
"Sóng thần siêu thanh", nghìn tỷ cảm biến (Peter Diamandis): Moonshots
Reflection AI × SpaceX ($6,3 tỷ), Groq ($650 triệu), Baseten ($1,5 tỷ): Bloomberg, TechCrunch
Bài học Jack Ma & Alibaba, danh sách đen: hồ sơ công khai
Seedance 2.5 (ByteDance) · SQLite viết lại bằng Rust: Bài giảng AI Updates
Hẹn gặp lại ở bài viết sau!
Bạn muốn nghe Podcast?
🎤 Spotify: Project AI - AI 24h |
🎤 Apple Podcasts : AI 24h |


