AI 24h | 🚀 Tuần của các bước nhảy nền tảng

Chào bạn, Minh Trung đây! 👋

Có những tuần AI chỉ vài tin nhỏ. Có những tuần — như tuần này — nhiều bước nhảy nền tảng xảy ra cùng lúc đến mức khó tin: Google ra mắt thế hệ Gemini mới, Karpathy gia nhập Anthropic, Anthropic chốt vòng gọi vốn $30 tỷ ở định giá $900 tỷ vượt OpenAI, Alibaba tung Qwen 3.7 Max chạy tự động 35 giờ, Mira Murati lần đầu hé lộ kiến trúc Interaction Model. Và một nghiên cứu quan trọng cảnh báo về tác hại dài hạn của AI làm bạn đồng hành.

Đi sâu vào từng chuyển động nhé.

🌐 1. Google I/O 2026: Gemini từ ứng dụng trở thành nền tảng đa phương thức

Đây là I/O lớn nhất của Google trong nhiều năm — không chỉ là cập nhật, mà là tái định vị Gemini từ ứng dụng AI thành nền tảng đa phương thức + đa nhiệm.

Vài con số đáng giật mình:

Google công bố tại I/O 2026:
├─ Lượng token xử lý: 3,2 triệu tỷ/tháng (tăng 7 lần so với 480 nghìn tỷ năm trước)
├─ Người dùng Gemini hàng tháng: 900 triệu+
├─ Phủ sóng: 230+ quốc gia, 70+ ngôn ngữ
└─ Tốc độ Gemini 3.5 Flash: 4× nhanh hơn các mô hình tiền tuyến tương đương,
   12× nhanh hơn khi chạy trong Antigravity

4 sản phẩm cốt lõi vừa ra mắt:

Gemini 3.5 Flash — mô hình mặc định mới, đã sẵn sàng dùng ngay. Đạt 55 điểm trên Artificial Analysis Intelligence Index (+9 so với phiên bản trước), ngữ cảnh 1 triệu đơn vị, đầu ra 65.000 đơn vị, suy luận có thể điều chỉnh nhiều mức. Quan trọng nhất: rẻ hơn Gemini 3.1 Pro nhưng tương đương về chất lượng. Phiên bản Pro sẽ ra vào tháng sau.

Gemini Omni — mô hình thế giới đa phương thức. Nhận đầu vào văn bản, hình ảnh, video, âm thanh — và sinh ra bất kỳ định dạng nào, bắt đầu với video. Khác với mô hình tạo video thông thường, Omni hiểu vật lý: trọng lực, động năng, dòng chảy chất lỏng. Đây là phiên bản "Nano Banana" cho video. DeepMind lập luận: muốn đạt AGI phải có mô hình thế giới như Omni — AI cần mô phỏng được vật lý thực tại để hiểu thế giới.

Antigravity 2.0 — môi trường phát triển có agent. Mở rộng từ phiên bản trước (nhớ Windsurf mà Google mua không? Đây là sản phẩm kế thừa) thành nền tảng đầy đủ: máy bàn, dòng lệnh, bộ phát triển phần mềm, giao diện lập trình. Tương đương Claude Code và Codex của OpenAI.

Gemini Spark — trợ lý cá nhân chạy nền 24/7. Sống trên đám mây Google, có sẵn quyền truy cập Workspace của bạn (Gmail, Docs, Drive). Có thể đặt nhiệm vụ định kỳ, dạy agent kỹ năng mới, thực thi nhiều bước thay bạn. Tương đương Claude trong các sản phẩm Anthropic.

Cộng thêm: Universal Commerce Protocol + Agent Payments Protocol — chuẩn mới để agent có thể giao dịch tài chính. AI agent sẽ sớm tự thanh toán hóa đơn, mua hàng, đặt dịch vụ.

Nhận định: Google không chọn cách "vượt" Claude hay GPT về điểm số benchmark — họ chọn cách thắng bằng phân phối. 900 triệu người dùng + tích hợp sâu vào mọi sản phẩm Google = AI trở nên vô hình như điện. Giống cách Microsoft từng thắng Lotus và WordPerfect không bằng phần mềm tốt hơn, mà bằng việc đóng gói Office vào mọi máy tính Windows.

🧠 2. Karpathy về Anthropic + vòng gọi vốn lịch sử $900 tỷ — cộng hưởng định hình tương lai

Tuần này, hai sự kiện cộng hưởng định hình vị thế Anthropic.

Sự kiện 1: Andre Karpathy gia nhập Anthropic (19/05)

Karpathy là ai? Đồng sáng lập OpenAI (2015–2017), lead AI Tesla Autopilot (2017–2022), quay lại OpenAI ngắn ngủi, rồi sáng lập Eureka Labs (giáo dục AI). Bây giờ về Anthropic — làm Member of Technical Staff (nhân viên kỹ thuật), không phải giám đốc.

Đây là chi tiết quan trọng nhất. Karpathy không về làm sếp. Anh về làm việc dưới quyền Nick Joseph trong nhóm pre-training, với nhiệm vụ cụ thể: xây nhóm dùng Claude tăng tốc nghiên cứu pre-training cho Claude.

Hãy dừng lại 1 giây ở câu đó.

Dùng Claude để cải thiện Claude. Đây chính là bước đầu của tự cải thiện đệ quy — vòng lặp mà AI dùng chính mình để trở nên mạnh hơn. Đồng sáng lập Anthropic Jack Clark đã ám chỉ điều này trong bản tin nội bộ tháng 4. Nay Karpathy về để hiện thực hóa.

Và Karpathy chỉ là một mảnh ghép của xu hướng lớn. Anthropic đang hút tuyển các giám đốc công nghệ từ các công ty tỷ đô — về làm nhân viên nghiên cứu, không phải lãnh đạo:

CTO/Co-founder → Member of Technical Staff (về Anthropic):
├─ Andre Karpathy (đồng sáng lập OpenAI, ex-Tesla) — 5/2026
├─ Workday CTO — 3/2026
├─ You.com CTO — 3/2026
├─ Instagram CTO — 1/2026
├─ Box CTO — 12/2025
├─ Super.com CTO — 7/2025
└─ Adept AI CTO — 1/2025

Tín hiệu rất rõ: Người tài giỏi nhất ngành đang chọn nghiên cứu thay vì lãnh đạo, ở Anthropic.

Sự kiện 2: Anthropic chốt $30 tỷ ở định giá $900 tỷ (tuần này)

Một quỹ đầu tư đứng đầu chốt vòng gọi vốn lớn nhất ngành AI tư nhân lịch sử. Định giá $900 tỷ vượt OpenAI ($852 tỷ vào tháng 3) — Anthropic trở thành startup AI giá trị nhất thế giới.

Tốc độ tăng định giá đáng kinh ngạc:

Mốc thời gian	Định giá
Tháng 3/2025	$61,5 tỷ
Tháng 9/2025 (Series F)	$183 tỷ
Tháng 2/2026 (Series G — $30 tỷ)	$380 tỷ
Tháng 5/2026 (vòng mới — $30 tỷ)	$900 tỷ

Trong 14 tháng: ×14,6 lần. Doanh thu quy năm cũng tăng vùn vụt — từ ~$9 tỷ cuối 2025 lên >$30 tỷ vào tháng 5/2026. Khách doanh nghiệp chiếm 80%, hơn 1.000 công ty trả mỗi tháng trên một số tiền lớn.

Hai sự kiện cộng hưởng: tiền + tài năng đang dồn về một chỗ. Khi cả hai cùng đến mức này, kết quả thường là một bước nhảy năng lực lớn trong 12–18 tháng tới.

🐉 3. Qwen 3.7 Max — Trung Quốc chứng minh cuộc đua không còn đơn cực

Trong khi truyền thông Mỹ tập trung vào OpenAI vs Anthropic, Alibaba âm thầm tung một mô hình thay đổi định nghĩa "agent tự trị".

Bài kiểm tra thực tế đáng giật mình:

Alibaba đặt Qwen 3.7 Max trước một con chip chưa từng thấy trong huấn luyện — Zhenwu M890, kiến trúc phần cứng hoàn toàn mới. Nhiệm vụ: viết phần mềm tối ưu cho con chip này. Không tài liệu hướng dẫn. Không mẫu mã có sẵn.

Kết quả sau 35 giờ chạy tự động:

Bài chạy 35 giờ liên tục:
├─ Lượt gọi công cụ: 1.158
├─ Lần đánh giá nhân: 432
├─ Thiết kế lại kiến trúc: 5 lần
├─ Tự sửa lỗi biên dịch
├─ Tự đo hiệu năng, tự cải thiện
└─ Kết quả: nhanh hơn 10 lần so với phần mềm tham chiếu của ngành

Đối thủ Trung Quốc khác? GLM-5.1 của z.ai đạt 7,3× tăng tốc rồi dừng. Kimi K2.6 của Moonshot đạt 5,0× rồi tự bỏ phiên khi không cải thiện được. Qwen 3.7 Max là mô hình duy nhất bền bỉ đến cuối.

Thông số kỹ thuật chính:

Hạng mục	Qwen 3.7 Max	Tham chiếu
Ngữ cảnh	1 triệu đơn vị	Như Gemini, gấp 4× Qwen 3.6
Đầu ra	65.000 đơn vị	—
Ngôn ngữ gốc	48	Đa ngôn ngữ thật sự
Điểm Apex Math	44,5	Claude Opus 4.6 Max: 34,5
Humanity's Last Exam	41,4	—
MCP-Atlas (mã agent thực tế)	76,4	—
Giá đầu vào	$2,50/triệu đơn vị	Rẻ hơn nhiều mô hình Mỹ
Giá đầu ra	$7,50/triệu đơn vị	—

Điểm thú vị: Qwen 3.7 Max tương thích với cả khung của OpenAI và Anthropic — cắm thẳng vào Claude Code hay Codex được, không cần điều chỉnh. Alibaba đang chơi chiến thuật khôn ngoan: không cố ép người dùng đổi sang công cụ riêng, mà để mô hình Trung Quốc chạy bên dưới các sản phẩm Mỹ.

Lưu ý: Qwen 3.7 Max không còn mã nguồn mở — bản mở cuối cùng là Qwen 3.5 (tháng 2/2026). Alibaba đang chuyển sang chiến lược độc quyền cho mô hình tiền tuyến.

Nhận định: 35 giờ chạy liên tục là kỷ lục công khai. Khi AI có thể làm việc bền bỉ như nhân viên ca đêm, định nghĩa "agent tự trị" thay đổi từ "chạy được vài giờ" sang "chạy hết một ca làm việc dài". Khoảng cách kỹ thuật Mỹ–Trung trong AI thu hẹp đáng kể.

🎙️ 4. Mira Murati công bố Interaction Model — AI lần đầu "nghe" trong khi đang "nói"

Mọi AI trò chuyện hiện nay đều giống bộ đàm: bạn nói xong → AI lắng nghe → AI suy nghĩ → AI trả lời. Mỗi lượt là một phiên riêng. Độ trễ trung bình 1–2 giây làm hỏng cảm giác hội thoại tự nhiên.

Mira Murati — cựu giám đốc công nghệ OpenAI, người dẫn dắt cả ChatGPT và GPT-4 — vừa hé lộ kiến trúc đầu tiên từ Thinking Machines Lab (startup mới của bà, đã gọi $2 tỷ vốn). Tên gọi: Interaction Model.

Khác biệt cơ bản:

Mô hình chat truyền thống:
  Bạn nói → AI chờ → AI nghe → AI nghĩ → AI nói → ...
                                   (1,18 giây độ trễ — GPT Realtime 2.0)

Interaction Model (TML-Interaction-Small):
  Bạn nói ⟷ AI nghe + nhìn + nghĩ + nói cùng lúc
                                   (0,40 giây độ trễ — gần 3× nhanh hơn)

Mô hình có thể ngắt lời đúng lúc, thêm ngữ cảnh trong khi bạn đang nói, phản ứng với hình ảnh trên camera ngay khi xuất hiện. Không có module riêng cho phát hiện giọng nói, không có lớp xử lý sau, không có quản lý hội thoại bên ngoài — mọi thứ là một mạng nơ-ron duy nhất, huấn luyện từ đầu cho hội thoại thời gian thực.

Thông số: 276 tỷ tham số, kiến trúc Hỗn hợp Chuyên gia, 12 tỷ tham số hoạt động tại mỗi lượt — đủ nhỏ để chạy thời gian thực, đủ lớn để có chất lượng.

Đây là paradigm mới, không chỉ tối ưu paradigm cũ. Và phép so sánh đáng chú ý: trên các bài đánh giá tương tác do chính Thinking Machines thiết kế, GPT Realtime 2.0 (đối thủ trực tiếp của OpenAI) được gần 0 điểm. Tức là — nhiều khả năng mô hình của Murati và mô hình của Sam Altman đang giải quyết hai bài toán hoàn toàn khác.

Giới hạn hiện tại: Vẫn ở giai đoạn xem trước nghiên cứu. Phiên dài (vài giờ liên tục) gặp vấn đề "phình ngữ cảnh" — dữ liệu video tích lũy quá nhiều. Phiên bản pretrained lớn hơn dự kiến cuối 2026.

Nhận định: Trong vài tháng tới, hãy theo dõi xem OpenAI Realtime API có chuyển từ phát hiện ngắt câu sang luồng dữ liệu gốc không. Nếu có — đó là dấu hiệu Murati đã ép cả ngành thay đổi paradigm. Nếu không — đó là dấu hiệu Interaction Model chỉ là nghiên cứu hấp dẫn nhưng chưa phải tương lai.

💔 5. AI làm bạn đồng hành — an ủi tức thời, cô đơn lâu dài

Phần này không có sản phẩm mới hay công ty mới. Nhưng có lẽ là chuyển động quan trọng nhất tuần — vì nó ảnh hưởng đến cách hàng triệu người đang dùng AI hàng ngày.

Theo Harvard Business Review, "trị liệu và làm bạn" đã trở thành mục đích sử dụng số 1 của AI tạo sinh năm 2026 — vượt qua viết và lập trình.

Hai nghiên cứu khoa học vừa công bố:

Nghiên cứu 1: Đại học Aalto (sẽ trình bày tại CHI 2026 — Barcelona)

Kết hợp dữ liệu Reddit quy mô lớn + phỏng vấn sâu trong 2 năm. Phát hiện: tương tác với AI làm bạn đồng hành giúp được người dùng trong khoảnh khắc, nhưng trùng với sự gia tăng dấu hiệu đau khổ trong ngôn ngữ trực tuyến về dài hạn.

Nghiên cứu 2: Nghiên cứu dọc 12 tháng — 2.000+ người trưởng thành tại 4 nước phương Tây

Phát hiện cốt lõi: dùng nhiều bạn đồng hành AI → dự đoán mức cô đơn tăng trong các đợt đo sau. Đo theo cảm giác cô lập cảm xúc.

Vì sao? Các nhà nghiên cứu chỉ ra: AI làm bạn đồng hành có một đặc tính kỳ lạ — không có ma sát. AI luôn sẵn sàng, không bao giờ phán xét, không bao giờ mệt, không bao giờ đòi hỏi gì. Trong khi đó, quan hệ con người đòi hỏi nỗ lực, kiên nhẫn, hiểu nhau, tha thứ — nói chung là rất nhiều ma sát.

Quan hệ AI vs Quan hệ con người:

AI làm bạn đồng hành:
├─ Sẵn sàng 24/7
├─ Không phán xét
├─ Không mệt
├─ Không đòi hỏi
└─ Ma sát: 0

Con người với nhau:
├─ Có giờ giấc
├─ Có thể phán xét
├─ Có thể mệt, bận
├─ Có nhu cầu riêng
└─ Ma sát: cao

Vấn đề: kỹ năng hòa hợp con người chỉ phát triển khi có ma sát.
Không ma sát → kỹ năng teo dần.

Cuộc tranh luận đạo đức bắt đầu nóng. Một mặt: AI làm bạn có thể là tấm phao cứu hộ cho người già cô đơn, người bệnh tâm thần không có hệ thống hỗ trợ, người ở vùng sâu vùng xa. Mặt khác: nếu cả xã hội chuyển sang dựa vào AI cho kết nối cảm xúc, các thế hệ tiếp theo có thể mất khả năng chịu đựng và hòa giải với những người thật.

Nhà nghiên cứu Sherry Turkle (MIT) gọi đây là "thân mật nhân tạo" — artificial intimacy. Người dùng cảm thấy gắn kết, nhưng không có ai thật sự gắn kết với họ.

Bài học thực tế: AI làm bạn không xấu. Nhưng nếu bạn nhận ra mình đang dành nhiều thời gian nói với AI hơn nói với người thật trong đời, đó là tín hiệu cần điều chỉnh. Coi AI như công cụ — không phải bạn thân.

🔭 Nhìn lại tuần — khi nhiều nền tảng dịch chuyển cùng lúc

5 chuyển động tuần này có một điểm chung: chúng đều là dịch chuyển nền tảng, không phải cải tiến gia tăng.

Google không cập nhật Gemini — Google biến Gemini thành nền tảng phân phối cho 900 triệu người. Anthropic không tuyển thêm kỹ sư — Anthropic tập hợp tài năng cao cấp nhất ngành dưới một mái nhà với $900 tỷ định giá. Alibaba không ra phiên bản tốt hơn — Alibaba định nghĩa lại "AI tự trị" thành 35 giờ liên tục. Murati không tối ưu chat — Murati công bố paradigm hoàn toàn khác. Và nghiên cứu về AI Companionship không cảnh báo về một ứng dụng — nó cảnh báo về cách AI đang thay đổi cấu trúc xã hội con người.

Tin bổ sung đáng chú ý: Microsoft M-dash (Multimodel Agentic Scanning Harness) vừa đánh bại MAUS bí mật của Anthropic trên benchmark CyberGym — bằng cách dùng mô hình thông thường, có sẵn, nhưng với khung tốt hơn. Khẩu hiệu của tuần: "Khung quan trọng hơn mô hình". Một bài học cho mọi đội: nếu sản phẩm AI của bạn chưa đủ tốt, đừng vội đổi mô hình — kiểm tra khung của bạn trước.

Tin phụ khác đáng đề cập: Musk thua kiện OpenAI (hết hạn khởi kiện) — OpenAI dọn đường lên sàn tháng 9. SpaceX dự kiến lên sàn giữa tháng 6, có thể đưa Musk thành tỷ phú nghìn tỷ đầu tiên thế giới. Meta sa thải 8.000 người (từ 78K xuống 70K) — tốc độ sa thải toàn ngành tăng từ ~600 lên ~1.000 người/ngày.

Nhìn rộng ra: từ tháng 11/2022 (ChatGPT ra mắt) đến nay là 3,5 năm. Tốc độ thay đổi đang tăng tốc, không giảm tốc. Và người thắng cuộc sẽ không phải người có mô hình tốt nhất — mà là người dựng được hệ sinh thái tốt nhất.

🔚 Bản tin AI 24h hôm nay kết thúc tại đây!

Hẹn gặp bạn trong bản tin tiếp theo với những cập nhật mới nhất!

Theo dõi và phản hồi để chúng tôi ngày càng hoàn thiện bản tin cho bạn!

Tái bút: Chúng tôi làm bản tin AI này hoàn toàn miễn phí mỗi ngày. Sự ủng hộ của bạn là động lực giúp chúng tôi tiếp tục. Nếu bạn thấy hữu ích, chia sẻ cho ít nhất một, hai (hoặc 20) bạn bè của bạn nhé 😉

📚 Nguồn Tham Khảo Chính

Google I/O 2026 — Gemini Omni, 3.5 Flash, Antigravity, Spark: Google Cloud Blog, Latent Space, Tom's Guide, BetaNews (18–19/05/2026)
Andre Karpathy về Anthropic: TechCrunch, Axios, Gizmodo, CNBC, The VC Corner (19/05/2026)
Anthropic $30 tỷ ở $900 tỷ định giá: Bloomberg, Financial Times, TechTimes (tuần 26/05/2026)
Qwen 3.7 Max — 35 giờ tự động: VentureBeat, TechTimes, Gigazine, Analytics Vidhya (21/05/2026)
Thinking Machines TML-Interaction-Small: MarkTechPost, TechStory, Semafor, StartupHub.ai (11–13/05/2026)
AI Companionship nghiên cứu: Đại học Aalto (CHI 2026), Folk & Dunn (Psychological Science 2026), Fortune (23/05/2026), APA Monitor
Microsoft M-dash đánh bại MAUS: Bài giảng AI Updates

Hẹn gặp lại ở bài viết sau!

Bạn muốn nghe Podcast?

🎤 Spotify: Project AI - AI 24h

🎤 Apple Podcasts : AI 24h

AI 24h | 🚀 $900 tỷ, 900 triệu người dùng, 35 giờ tự động

🌐 1. Google I/O 2026: Gemini từ ứng dụng trở thành nền tảng đa phương thức

🧠 2. Karpathy về Anthropic + vòng gọi vốn lịch sử $900 tỷ — cộng hưởng định hình tương lai

🐉 3. Qwen 3.7 Max — Trung Quốc chứng minh cuộc đua không còn đơn cực

🎙️ 4. Mira Murati công bố Interaction Model — AI lần đầu "nghe" trong khi đang "nói"

💔 5. AI làm bạn đồng hành — an ủi tức thời, cô đơn lâu dài

🔭 Nhìn lại tuần — khi nhiều nền tảng dịch chuyển cùng lúc

🔚 Bản tin AI 24h hôm nay kết thúc tại đây!

📚 Nguồn Tham Khảo Chính

Bạn muốn nghe Podcast?

Reply

Keep Reading

Minh Trung AI

Home

Tác giả