Chào bạn, Minh Trung đây! 👋

Tuần này có một thay đổi mà nếu bạn bỏ lỡ, sẽ khó hiểu mọi thứ đang xảy ra sau đó. Đó không phải một tính năng mới hay một sản phẩm mới — mà là cách AI hoạt động đã thay đổi từ gốc rễ. Giống như chuyển từ gửi thư tay sang dùng điện thoại — cùng mục đích liên lạc, nhưng cơ chế vận hành hoàn toàn khác.

Tóm tắt nhanh 5 chuyển động: Claude Code giờ nhận mục tiêu rồi tự chạy, tự chia việc cho nhiều "nhân viên phụ". Meta tung Muse Spark — 16 bộ não chuyên biệt chạy đồng thời, hơn nghìn tỷ tham số. Bịa đặt của AI hóa ra có 2 loại hoàn toàn khác nhau (1,5% khi tóm tắt nhưng 86% khi tự nghĩ). Cerebras lên sàn chứng khoán thu $5,55 tỷ với con chip to bằng cái đĩa. Và Anthropic chính thức vượt mặt OpenAI trong doanh nghiệp.

Đi sâu vào từng chuyển động nhé.

🤖 1. Từ "thư ký trả lời câu hỏi" sang "nhân viên toàn thời gian tự làm việc"

Đây là thay đổi kiến trúc — không chỉ là thêm nút bấm mới.

Hãy hình dung 2 cách làm việc khác nhau. Cách cũ giống bạn nhắn tin hỏi thư ký: "Giá vé máy bay Hà Nội — Sài Gòn bao nhiêu?" → thư ký tra rồi trả lời → xong, quên hết. Cách mới giống bạn giao nhiệm vụ cho nhân viên: "Đặt giúp tôi vé khứ hồi tuần sau, chọn giá tốt nhất, ghế cửa sổ" → nhân viên tự tìm, so sánh, đặt, gửi xác nhận → bạn chỉ nhận kết quả.

Cách cũ (hỏi-đáp):
  Bạn → Câu hỏi → AI → Câu trả lời → Kết thúc (quên hết)

Cách mới (giao việc):
  Bạn → Mục tiêu → AI lập kế hoạch → [Bước 1 → Kiểm tra → Bước 2 → ... → Bước N] → Báo cáo
                                           ↓              ↓
                                      Phụ tá A        Phụ tá B

Claude Code tuần này vận hành chính xác theo mô hình "nhân viên" này. Bạn mô tả đích đến, nó tự chia thành các bước, rồi chạy — thậm chí tự gọi thêm phụ tá để xử lý song song nhiều phần cùng lúc. Giống quản lý dự án — khi thấy việc quá nhiều, tự phân công thêm người.

Tính năng thú vị nhất tuần: "Giấc mơ" — giờ có ở cả Claude lẫn Hermes. Ý tưởng rất hay: thỉnh thoảng, AI tự "ngủ" để dọn dẹp bộ nhớ. Giống nhân viên giỏi cuối tuần ngồi sắp xếp lại hồ sơ, ghi chú lại bài học, và viết quy trình cho những việc hay làm đi làm lại. Cụ thể:

  • Rà soát lại toàn bộ lịch sử hội thoại và bộ nhớ dài hạn

  • Loại bỏ thông tin thừa, gộp những thứ trùng lặp

  • Nếu thấy việc nào lặp lại nhiều → viết thành "kỹ năng" sẵn để lần sau làm nhanh hơn

  • Cải thiện kỹ năng cũ dựa trên kết quả thực tế

Hermes (151.000 lượt yêu thích trên GitHub) đi xa hơn: nó nhớ bạn xuyên suốt các phiên làm việc — giống nhân viên cố định, lần sau không cần giải thích lại từ đầu.

So sánh nhanh giữa 3 "nhân viên AI" phổ biến:

Gợi ý thực tế: khi dùng AI, hãy thử giao mục tiêu thay vì hỏi từng câu. Thay vì "Tóm tắt email này", hãy thử "Đọc 50 email tuần này, lọc ra 5 cái quan trọng nhất, soạn nháp phản hồi." Sự khác biệt giống hệt việc gửi tin nhắn hỏi đường từng ngã tư so với nói "Đưa tôi đến sân bay."

🔥 2. Muse Spark — Meta cho 16 "bác sĩ chuyên khoa" hội chẩn cùng lúc

Meta đã thay đổi chiến thuật hoàn toàn. Trước giờ mọi mô hình Llama đều mã nguồn mở — ai cũng xài miễn phí. Muse Spark là mô hình độc quyền đầu tiên, đánh dấu Meta chơi nghiêm túc hơn.

Điều đáng chú ý nhất là kiến trúc. Hầu hết AI hiện tại giống 1 bác sĩ đa khoa — biết hết nhưng không chuyên sâu lĩnh vực nào. Muse Spark giống 16 bác sĩ chuyên khoa hội chẩn — mỗi người giỏi 1 mảng, và với mỗi câu hỏi, hệ thống tự chọn 2 chuyên gia phù hợp nhất để trả lời.

Cách Muse Spark hoạt động (ước tính):

Câu hỏi của bạn → Bộ phân loại (chọn chuyên gia phù hợp)
                        ↓
    ┌──────────────────────────────────────────────┐
    │ Chuyên gia 1 │ Chuyên gia 2 │...│ Chuyên gia 16 │
    │  (~70 tỷ      │  (~70 tỷ      │   │  (~70 tỷ       │
    │  tham số)     │  tham số)     │   │  tham số)      │
    └──────────────────────────────────────────────┘
                        ↓
         Chọn 2 chuyên gia → Tổng hợp câu trả lời

Tổng "kiến thức": ~1,12 nghìn tỷ tham số (16 × 70 tỷ)
Lượng "suy nghĩ" mỗi lượt: ~140 tỷ (chỉ 2/16 chuyên gia làm việc)

Tại sao thiết kế này hay? Vì nó giống bệnh viện lớn: có đủ chuyên khoa cho mọi ca bệnh (kiến thức rộng), nhưng mỗi ca chỉ cần 2 bác sĩ khám (chi phí thấp). So với mô hình "1 bác sĩ đa khoa biết hết" cùng quy mô, cách này tiết kiệm năng lực tính toán đáng kể mà vẫn giữ chất lượng.

Muse Spark do Alexandr Wang (cựu đồng sáng lập Scale AI) dẫn dắt. Meta rót $14,3 tỷ mua 49% Scale AI để đưa Wang về, và dự chi $115–135 tỷ cho AI năm nay — gần gấp đôi năm ngoái.

Trên bảng xếp hạng, Muse Spark xếp ngay sau Claude — vượt GPT và Gemini ở nhiều tác vụ. Nhưng Meta tự thừa nhận còn yếu ở hệ thống chạy dài hơi và viết mã — đúng chỗ Claude Code đang thống trị.

Điều thú vị: 2 hãng chọn 2 chiến trường khác nhau.

Giống 2 chuỗi nhà hàng: một bên đặt quầy trong siêu thị (Meta — ai cũng ghé), bên kia mở nhà hàng riêng cho doanh nghiệp đặt tiệc (Anthropic — ít khách nhưng hóa đơn lớn).

🎭 3. AI "bịa" có 2 kiểu — và hầu hết mọi người đang nhầm

Đây là phần quan trọng nhất tuần, đặc biệt nếu bạn đang dùng AI cho công việc thật.

Hãy hình dung 2 bài kiểm tra khác nhau.
Bài 1: thầy đưa cho bạn cuốn sách 100 trang, bảo tóm tắt lại 1 trang — đáp án nằm ngay trước mắt, bạn chỉ cần chọn lọc.
Bài 2: thầy hỏi "Ai phát minh ra máy bay?" mà không cho tài liệu — bạn phải tự nhớ, tự nghĩ, và nếu quên thì rất dễ... bịa.

AI cũng vậy, và dữ liệu tuần này cho thấy sự chênh lệch kinh hoàng:

Nhìn kỹ: Claude tóm tắt chỉ sai 1,5%, nhưng khi tự tra cứu thì sai 36%. GPT-5 lên đến 86%. Cùng một AI, 2 cách hỏi, kết quả trời và đất.

Lưu ý: "86% bịa" không có nghĩa 86% nội dung sai. Mà là trong 86% câu trả lời, có ít nhất 1 chi tiết bị bịa. Vẫn nghiêm trọng, nhưng cần hiểu đúng cách đo.

Nguyên tắc chung rất đơn giản: càng cho AI nhiều tài liệu gốc, nó càng ít bịa. Giống cho học sinh mang sách vào phòng thi — tỷ lệ viết đúng tăng lên ngay.

6 cách giảm bịa đặt — xếp theo hiệu quả:

1. Đưa tài liệu gốc trước khi hỏi (hiệu quả nhất). Thay vì hỏi "Luật lao động Việt Nam quy định gì về nghỉ phép?", hãy dán nguyên văn luật vào rồi hỏi "Theo văn bản này, quy định nghỉ phép là gì?" Chuyển từ "bài thi tự luận" sang "bài chép sách" — AI gần như không bịa.

2. Bật chế độ suy luận mở rộng. Cho AI "nháp bài" trước khi nộp đáp án. Claude với chế độ suy luận đạt 0% bịa đặt trên một số thước đo.

3. Bắt trích dẫn nguồn. Viết rõ trong câu lệnh: "Ghi rõ nguồn cho mỗi ý. Nếu không có nguồn, nói thẳng là không biết." Giống bắt học sinh ghi chú thích — không ghi được thì thà bỏ trống.

4. Đặt nhiệt độ bằng 0. Loại bỏ yếu tố ngẫu nhiên khi AI chọn từ. Ít "sáng tạo" hơn, nhưng chính xác hơn nhiều.

5. Hỏi 3 AI khác nhau, lấy phần đồng ý. Perplexity Max dùng cách này — chi phí cao nhưng rất đáng tin.

6. Dùng AI thứ 2 làm "giám khảo" kiểm tra kết quả AI thứ 1 trước khi gửi cho bạn.

Bài học ngắn gọn: Trước khi nói "AI hay bịa", hãy tự hỏi: "Mình đang cho nó thi tự luận hay cho chép sách?"

🧱 4. Cerebras lên sàn: con chip to bằng cái đĩa hút $5,5 tỷ trong 1 ngày

Thứ Năm tuần này, Cerebras lên sàn NASDAQ và gây chấn động cả Phố Wall.

Câu chuyện bằng con số:

  • Giá dự kiến ban đầu: $115–125/cổ phiếu

  • Giá chào bán thực tế: $185 (nâng vì nhu cầu quá lớn)

  • Giá mở cửa phiên đầu: $350 (gần gấp đôi giá chào)

  • Đỉnh trong ngày: $386

  • Đóng cửa ngày đầu: $311 (tăng 68%)

  • Tổng thu: $5,55 tỷ — lượng đăng ký mua gấp 20 lần số lượng chào bán

  • Vốn hóa đóng cửa: ~$67 tỷ

Đây là đợt lên sàn công nghệ lớn nhất nước Mỹ kể từ Uber năm 2019.

Tại sao Cerebras đặc biệt? Vì họ làm chip khác hoàn toàn cách mà Nvidia và AMD đang làm. Để dễ hình dung:

Cách truyền thống giống xây nhà từ gạch: đúc từng viên gạch nhỏ (chip riêng lẻ) → xếp chồng lên nhau → nối dây điện giữa các viên → xong ngôi nhà. Vấn đề: dây điện giữa các viên gạch tạo ra độ trễ — dữ liệu phải "chạy" từ viên này sang viên kia.

Cách Cerebras giống đổ bê tông nguyên khối: giữ nguyên cả tấm silicon làm 1 chip duy nhất, to bằng cái đĩa ăn cơm (~21×21cm). Không có dây nối giữa các phần → không có độ trễ.

Thông số con chip WSE-3 của Cerebras:
├─ Bóng bán dẫn: 4 nghìn tỷ (con)
├─ Lõi xử lý AI: 900.000 (lõi)
├─ Tốc độ suy luận: nhanh gấp ~15 lần cụm GPU thông thường
├─ Bộ nhớ ngay trên chip: ~40GB
└─ Kích thước: ~462 cm² (gần bằng 1 tấm wafer tròn 300mm)

Hạn chế: khi đúc 1 tấm chip khổng lồ, chỉ cần 1 điểm lỗi là cả tấm hỏng. Cerebras xử lý bằng cách thiết kế lõi dự phòng — giống xây nhà thừa vài phòng, phòng nào hỏng thì chuyển sang phòng bên cạnh.

Bối cảnh kinh doanh:

  • Doanh thu 2025: $510 triệu (tăng 76% so với năm trước)

  • Khách hàng: OpenAI (hợp đồng hơn $20 tỷ đến 2028), Amazon, Meta, IBM

  • Đang chuyển từ bán chip → cho thuê năng lực tính toán qua đám mây (cạnh tranh thẳng với Google, Oracle)

  • Rủi ro: 86% doanh thu 2025 đến từ chỉ 2 khách hàng liên quan UAE

Đợt lên sàn này là dấu hiệu rõ nhất: tiền đang đổ vào phần cứng AI ở quy mô chưa từng thấy. SpaceX, OpenAI, Anthropic đều có thể lên sàn trong năm nay. Cổ phiếu máy tính lượng tử cũng tăng vọt — có công ty tăng hơn 70% sau thông báo Nvidia.

🏁 5. Anthropic vượt OpenAI trong doanh nghiệp — và 3 rủi ro phía trước

Một năm trước, OpenAI dẫn 32% — Anthropic chỉ 8%. Tưởng không đuổi kịp.

Tuần này, theo chỉ số Ramp AI (theo dõi chi tiêu tại hơn 50.000 doanh nghiệp Mỹ): Anthropic vượt lên 34,4% — OpenAI tụt xuống 32,3%. Lần đầu tiên Anthropic dẫn trước.

Tỷ lệ doanh nghiệp Mỹ đang trả tiền:

Tháng 4/2025:  OpenAI    ████████████████████████████████ 32%
               Anthropic ████████ 8%

Tháng 4/2026:  Anthropic ██████████████████████████████████ 34,4%  ← VỪA VƯỢT
               OpenAI    ████████████████████████████████ 32,3%

Tổng doanh nghiệp Mỹ dùng AI: 50,6% (lần đầu quá bán)

Anthropic tăng gấp 4 trong 1 năm. OpenAI chỉ tăng 0,3%. Giống cuộc đua xe: chiếc phía sau tăng tốc liên tục trong khi chiếc dẫn đầu giữ nguyên tốc độ — sớm muộn cũng bị vượt.

Động lực chính: Claude Code — công cụ lập trình bằng AI của Anthropic. Vài con số ấn tượng:

  • ~4% tổng lượt đóng góp mã nguồn trên GitHub toàn cầu là do Claude Code tạo (gấp đôi trong 1 tháng)

  • 73% doanh nghiệp mua AI lần đầu chọn Anthropic (theo Ramp)

  • Doanh thu quy năm: Anthropic ~$30 tỷ so với OpenAI ~$24 tỷ (đã đảo ngược)

Nhưng chuyên gia kinh tế của Ramp đưa ra 3 cảnh báo rất đáng suy nghĩ:

Cảnh báo 1 — Lợi ích xung đột. Anthropic kiếm tiền khi bạn dùng nhiều → có xu hướng đẩy bạn sang mô hình đắt hơn, kể cả khi mô hình rẻ đủ tốt. Giám đốc công nghệ Uber đã thừa nhận công ty "tiêu sạch" ngân sách AI cả năm 2026 chỉ trong vài tháng.

Cảnh báo 2 — Không đủ máy chủ. CEO Dario Amodei nói Anthropic tăng trưởng 80 lần trong quý 1 — trong khi chỉ chuẩn bị cho 10 lần. Hậu quả: giới hạn sử dụng, dịch vụ gián đoạn, nhiều người bị "đuổi ra" giữa chừng. Hợp đồng thuê trung tâm dữ liệu SpaceX (Memphis) giải quyết tạm thời, nhưng chưa đủ.

Cảnh báo 3 — Chi phí hình ảnh tăng gấp 3. Bản cập nhật mới tăng gấp 3 chi phí cho câu lệnh có hình — đúng lúc ngày càng nhiều người gửi ảnh kèm.

OpenAI không ngồi yên: Ra mắt Codex (đối thủ trực tiếp Claude Code, rẻ hơn ở nhiều việc). Lập quỹ $4 tỷ đưa kỹ sư AI vào doanh nghiệp. ChatGPT vẫn nằm trong 5 trang web đông khách nhất thế giới.

Nhận định: Dữ liệu Ramp cho thấy số lượng doanh nghiệp, không phải doanh thu mỗi doanh nghiệp. OpenAI có thể vẫn thu nhiều tiền hơn từ vài hợp đồng lớn. Giống quán cà phê đông khách so với nhà hàng ít khách nhưng hóa đơn cao — hai kiểu thắng khác nhau. Cuộc đua còn rất dài.

🔭 Nhìn lại tuần — AI chuyển từ công cụ sang hạ tầng

5 chuyển động tuần này đều chỉ cùng 1 hướng: AI không còn là ứng dụng bạn mở lên dùng — nó đang trở thành nền tảng mà mọi thứ chạy trên đó. Giống điện: bạn không "dùng" điện, bạn sống trong thế giới vận hành bằng điện.

Kiến trúc AI đã chuyển từ hỏi-đáp sang tự trị. Hỗn hợp chuyên gia cho phép mô hình lớn hơn nhưng rẻ hơn. Bịa đặt có giải pháp — nếu hiểu đúng 2 loại. Phố Wall rót $5,5 tỷ cho chip AI trong 1 ngày. Và hơn 50% doanh nghiệp Mỹ giờ đang trả tiền cho AI.

Tin bổ sung đáng chú ý: Nhóm Tình báo của Google lần đầu xác nhận tin tặc dùng AI tạo lỗ hổng bảo mật chưa ai biết — vượt qua xác thực 2 lớp trên công cụ quản trị mã nguồn mở bằng mã Python. Dấu hiệu nhận biết: chú thích kiểu sách giáo khoa, điểm mức độ nghiêm trọng bị bịa, cấu trúc mã sạch bất thường — đều là "chữ ký" đặc trưng của AI. Chuyên gia Google cảnh báo: "Cuộc chiến đã bắt đầu rồi. Với mỗi lỗ hổng do AI tạo mà chúng tôi phát hiện, có lẽ còn nhiều cái khác ngoài kia."

Nhìn lại chặng đường:

  • Tháng 11/2022: ChatGPT ra đời — trả lời câu hỏi, nhớ được 6 trang, xong là quên

  • Tháng 5/2026: AI tự lập kế hoạch, chạy hàng giờ, nhớ cả nghìn trang, tự học hỏi, tự chia việc cho nhiều "nhân viên phụ"

Đó không phải tiến bộ dần dần. Đó là nhảy cóc.

🔚 Bản tin AI 24h hôm nay kết thúc tại đây!

Hẹn gặp bạn trong bản tin tiếp theo với những cập nhật mới nhất!

Theo dõi và phản hồi để chúng tôi ngày càng hoàn thiện bản tin cho bạn!

Tái bút: Chúng tôi làm bản tin AI này hoàn toàn miễn phí mỗi ngày. Sự ủng hộ của bạn là động lực giúp chúng tôi tiếp tục. Nếu bạn thấy hữu ích, chia sẻ cho ít nhất một, hai (hoặc 20) bạn bè của bạn nhé 😉

📚 Nguồn Tham Khảo Chính

  • Boris Cherny — "Why coding is solved": YouTube

  • Andrej Karpathy — Square event talk: YouTube

  • "No AI Agent Orchestration Needed" — nghiên cứu arXiv

  • "Harness More Important Than Model" (6× performance) — arXiv

  • Anthropic — Wall Street $1.5B deal, SpaceX compute: TechCrunch

  • Google Remy — agent cạnh tranh Open Claw: Google

  • Microsoft Copilot Actions: Microsoft

  • Mayo Clinic — AI phát hiện ung thư tụy sớm 3 năm: Mayo Clinic

  • Hermes Agent — tenacity release, self-maintaining skills: GitHub

  • InsForge — harness backend giảm chi phí: GitHub

  • Z Editor v1.0: zed.dev

  • Suno AI — $300M ARR, $5B valuation: TechCrunch

  • Sa thải: PayPal ~5.000, Jack Dorsey/Block 4.000 (40%)

  • Matthew Berman — Karpathy talk commentary: YouTube

Hẹn gặp lại ở bài viết sau!

Bạn muốn nghe Podcast?

Reply

Avatar

or to participate

Keep Reading