AI 24h | Một con chip không cần GPU, một dòng code xóa 31 tỷ đô

Chào bạn, Minh Trung đây! 👋

Tuần vừa rồi, thế giới AI không chỉ cập nhật — nó rung chuyển.

Một startup vô danh nhét cả model AI vào một con chip duy nhất. Anthropic demo Claude viết COBOL và IBM mất 31 tỷ đô trong một ngày. OpenClaw bùng nổ với 232.000 sao trên GitHub nhưng bị cả Anthropic lẫn Google "cấm cửa". Và cha đẻ AlphaGo rời DeepMind để xây dựng thứ gì đó vượt xa LLM.

Nhưng nếu bạn chỉ nhớ một điều duy nhất từ tuần này, hãy nhớ câu này: "Model không quan trọng. Cách bạn dùng model mới quan trọng."

Nghe có vẻ nghịch lý đúng không? Hãy cùng đi qua 7 chuyện lớn nhất tuần để hiểu tại sao.

🎯 Harness Engineering — Kỹ năng mới của thời AI

Bảng xếp hạng LM Arena tuần này không có gì bất ngờ: Claude Opus 4.6 vẫn đứng đầu cả hai bảng text và coding. Gemini 3.1 Pro bám sát phía sau. GPT 5.2 (không phải 5.3) ở vị trí khiêm tốn hơn.

Nhưng đây mới là điểm đáng chú ý: tất cả các model hàng đầu đều đạt 90%+ trên benchmark (bài kiểm tra tiêu chuẩn), nhưng trong thực tế chỉ hoàn thành khoảng 20-30% nhiệm vụ.

Khoảng cách đó không phải lỗi của model. Đó là lỗi của cách chúng ta sử dụng model.

Khái niệm "Harness Engineering" (kỹ thuật xây dựng khung vận hành quanh model) đang nổi lên như triết lý trung tâm: thay vì chạy đua tìm model tốt nhất, hãy xây dựng "bộ khung" xung quanh model tốt nhất. Nghĩa là: cấu trúc prompt, pipeline xử lý, hệ thống kiểm tra, và đặc biệt là team of agents phối hợp với nhau.

Ví dụ cụ thể? AT&T vừa công bố cắt giảm 90% chi phí AI bằng multi-agent architecture (kiến trúc đa tác tử) — thay vì dùng một model lớn cho mọi thứ, họ dùng model nhỏ hơn, rẻ hơn, nhanh hơn cho từng task cụ thể. Model nào cũng được. Cách dùng mới là chìa khóa.

🦞 OpenClaw bùng nổ — rồi bị "siết"

OpenClaw đang là hiện tượng. 232.000 sao GitHub, tăng khoảng 2.000 sao mỗi ngày. Hệ sinh thái mở rộng chóng mặt: tích hợp Qwen 3.5, Gemini 3.1 Pro, Mistral, kết nối Zapier MCP cho 8.000 ứng dụng, thậm chí có cả Mission Control Dashboard và Agent Teams.

Nhưng đây là vấn đề: OpenClaw "ngốn" token quá nhiều.

Anthropic đã cấm sử dụng thuê bao cá nhân của Claude qua OpenClaw. Google cũng hạn chế truy cập Antigravity cho người dùng OpenClaw. Thậm chí Peter Steinberger — chính người tạo ra OpenClaw (giờ đã ở OpenAI) — tuyên bố sẽ bỏ hỗ trợ Google.

Vậy OpenClaw thực sự là gì? Một bài viết rất hay của Nader Dabit đã chỉ ra: OpenClaw về bản chất chỉ là sự kết hợp sạch sẽ của những building blocks đơn giản — sessions (phiên làm việc), system prompts (lệnh hệ thống), tools (công cụ), queues (hàng đợi), cron (lập lịch tự động), và multi-channel I/O (giao tiếp đa kênh). Anh ấy đã tái tạo phiên bản mini chỉ trong 400 dòng Python.

Nếu bạn biết dùng Claude Code, bạn có thể làm hầu hết mọi thứ OpenClaw làm — tạo skills, lên lịch tự động, làm việc với file local, kết nối website. Và quan trọng hơn: bạn vẫn giữ được subscription Claude mà không bị ban.

OpenClaw thực sự tỏa sáng khi bạn cần: chạy 24/7, giao tiếp đa kênh (WhatsApp, Telegram, Slack), xây dựng assistant dùng chung cho team, hoặc muốn một "Agent OS" (hệ điều hành cho AI agent) có sẵn plugin và message routing (điều phối tin nhắn).

Nói cách khác: OpenClaw là convenience abstraction (lớp tiện ích bọc ngoài), không phải fundamental capability unlock (mở khóa năng lực mới). Nhưng đôi khi, convenience chính là thứ mọi người cần.

⚡ Con chip 17.000 token/giây — không cần CPU, không cần GPU

Đây có lẽ là tin công nghệ ấn tượng nhất tuần.

Startup Taalas vừa tạo ra một con chip có thể xử lý 17.000 token mỗi giây với model Llama 3.1 8B. Tất cả weights (trọng số mô hình) được hardcode (ghi cứng) trực tiếp vào chip. Không cần CPU. Không cần GPU. Không cần bộ nhớ ngoài.

Con chip sử dụng chủ yếu quantization 3-bit (nén trọng số xuống 3-bit để giảm kích thước, một số vùng nhạy cảm dùng 6-bit). Tốc độ output gần như tức thì. Công ty đã huy động được 200 triệu đô.

Tại sao điều này quan trọng? Vì nó mở ra khả năng nhúng AI vào mọi thứ — thiết bị IoT (Internet vạn vật), ô tô, dây chuyền sản xuất, edge devices (thiết bị biên) — mà không cần kết nối internet hay phần cứng đắt đỏ. Mỗi model mới mất khoảng 2-3 tháng để "đúc" vào chip.

Hãy tưởng tượng: AI chạy ở tốc độ ánh sáng, ngay trong thiết bị bạn cầm trên tay. Đó không còn là tương lai xa nữa.

📉 Claude viết COBOL — IBM mất 31 tỷ đô trong một ngày

COBOL là ngôn ngữ lập trình từ thập niên 1960-80, và đây là sự thật đáng kinh ngạc: 95% giao dịch ATM tại Mỹ vẫn chạy trên COBOL và mainframe IBM.

Khi Anthropic demo Claude có khả năng đọc, phân tích, dịch và hiện đại hóa code COBOL, thị trường phản ứng ngay lập tức. Cổ phiếu IBM giảm 13%, tương đương 31 tỷ đô giá trị vốn hóa bốc hơi trong một phiên giao dịch.

Điều đáng suy ngẫm ở đây không chỉ là khả năng kỹ thuật của Claude. Mà là tín hiệu: AI đang đe dọa trực tiếp vào nguồn doanh thu cốt lõi của những gã khổng lồ IT truyền thống. COBOL modernization vốn là business trị giá hàng tỷ đô mỗi năm — và giờ một AI có thể làm điều đó.

💰 5. Mô hình kinh doanh AI mới — Từ SaaS đến "AI Skill Business"

Liam Ottley — người đã xây dựng thành công agency AI trong 3 năm qua bằng phương pháp no-code — đưa ra nhận định thú vị: OpenClaw là "iPhone moment" cho AI, tạo ra vô số cơ hội kinh doanh mới.

Anh ấy phân loại 5 dạng AI Skill Business:

📝 Pure Prompt Skills — bán file text chứa hướng dẫn chuyên gia (ví dụ: cách review hợp đồng pháp lý)
🔧 Utility Skills — script thực hiện task cụ thể (transcription YouTube, web scraping)
🔌 API Integration Skills — dạy AI cách tương tác với HubSpot, CRM
🖥️ Backend Service Skills — chạy server riêng xử lý việc nặng, user trả phí hàng tháng
📊 Proprietary Data Skills — AI insights dựa trên database độc quyền

Nhưng lời khuyên đáng giá nhất của Ottley lại rất "chán": tập trung vào consulting và agency work — xây dựng quan hệ dài hạn với doanh nghiệp, giải quyết những vấn đề "chậm" sẽ tồn tại trong 10 năm tới. Công nghệ thay đổi, nhưng nhu cầu tích hợp AI vào hệ thống cũ thì không.

Bản thân Ottley đang dùng Claude Code (không phải OpenClaw) để tự động hóa 70% hoạt động kinh doanh của mình.

🏠 6. GGML.ai về tay Hugging Face — Tương lai của Local AI

Georgi Gerganov — người Bulgaria tạo ra định dạng GGML và llama.cpp, hai trụ cột cho việc chạy LLM trên máy cá nhân — vừa gia nhập Hugging Face.

Tin tốt: tất cả project vẫn giữ open source. llama.cpp vẫn phát triển công khai với đóng góp cộng đồng.

Ý nghĩa sâu xa ở đây là: Hugging Face (kho model lớn nhất thế giới) kết hợp với llama.cpp (runtime inference — công cụ chạy model tối ưu nhất cho phần cứng local) tạo ra nền tảng mạnh mẽ cho "Local AI" — chạy AI hoàn toàn trên máy cá nhân, không phụ thuộc cloud, không lo privacy.

Gerganov gọi đây là "ngôi nhà dài hạn của Local AI" — một ván cược rằng ngày càng nhiều workload AI sẽ chạy locally thay vì trên cloud.

🧠 7. Cha đẻ AlphaGo rời DeepMind — Xây dựng trí tuệ "vượt xa LLM"

David Silver — huyền thoại đứng sau AlphaGo và AlphaZero — đã rời Google DeepMind để thành lập Ineffable Intelligence tại London.

Mục tiêu: xây dựng trí tuệ "học liên tục không ngừng" sử dụng reinforcement learning (học tăng cường) và world models (mô hình thế giới), thay vì LLM (mô hình ngôn ngữ lớn).

Quan điểm của Silver rất rõ ràng: LLM bị giới hạn căn bản vì chỉ học từ text do con người viết. Trong khi đó, agent học trực tiếp từ trải nghiệm trong môi trường phong phú có thể khám phá kiến thức và khả năng vượt xa những gì con người từng viết ra.

Startup đang huy động khoảng 1 tỷ đô với định giá 4 tỷ đô. Đây cũng là hướng đi mà Yann LeCun (Meta) đã ủng hộ từ lâu.

🔭 Nhìn lại tuần — và nhìn tới

Nếu rút ra một bức tranh lớn từ tuần này, đó là: AI đang chuyển từ "ai có model tốt nhất" sang "ai biết cách dùng AI tốt nhất".

OpenClaw bùng nổ vì mọi người muốn AI tự chủ, chạy 24/7. Nhưng Claude Code vẫn đủ mạnh cho phần lớn nhu cầu. Taalas chip chứng minh AI có thể chạy ở mọi nơi. Claude viết COBOL khiến IBM mất 31 tỷ đô — không phải vì model quá giỏi, mà vì cách ứng dụng quá đúng chỗ.

🎯 Harness Engineering. Đó là kỹ năng thực sự có giá trị trong thời đại AI.

Bạn không cần model mới nhất. Bạn cần biết cách xây dựng "cương" cho model — pipeline, agent team, cấu trúc prompt, và chiến lược deployment phù hợp.

Tuần tới hứa hẹn sẽ còn nóng hơn 🔥: Perplexity Computer cho autonomous tasks, Cursor computer-controlling agents, Claude Code hỗ trợ Remote Control, và cuộc đối đầu giữa Anthropic với Pentagon về việc sử dụng AI trong quân sự.

🤖 AI không còn là công cụ bạn sử dụng. AI giờ là đồng đội bạn cần học cách quản lý.

💬 Câu hỏi dành cho bạn: Bạn đang ở đâu trên hành trình này? Đang chạy theo model mới nhất, hay đang xây dựng harness của riêng mình?

🔚 Bản tin AI 24h hôm nay kết thúc tại đây!

Hẹn gặp bạn trong bản tin tiếp theo với những cập nhật mới nhất!

Theo dõi và phản hồi để chúng tôi ngày càng hoàn thiện bản tin cho bạn!

Tái bút: Chúng tôi làm bản tin AI này hoàn toàn miễn phí mỗi ngày. Sự ủng hộ của bạn là động lực giúp chúng tôi tiếp tục. Nếu bạn thấy hữu ích, chia sẻ cho ít nhất một, hai (hoặc 20) bạn bè của bạn nhé 😉

📚 Nguồn Tham Khảo Chính

LM Arena Leaderboard: https://lmarena.ai/leaderboard/text
OpenClaw GitHub: https://github.com/openclaw/openclaw
Nader Dabit, You Could've Invented OpenClaw: https://nader.substack.com/p/you-couldve-invented-openclaw
CATS-Net (Nature Computational Science): https://www.nature.com/articles/s43588-026-00956-4
Google Lyria 3: https://blog.google/innovation-and-ai/products/gemini-app/lyria-3/

Hẹn gặp lại ở bài viết sau!

Bạn muốn nghe Podcast?

🎤 Spotify: Project AI - AI 24h

🎤 Apple Podcasts : AI 24h