Ho Chi Minh City, Vietnam

Đỗ Xuân Lộc

Founder & CEO, Valixara · Solutions Architect (AI)

Tôi xây những hệ thống tự chứng minh điều chúng đã làm — guardrail xác định bao quanh mô hình xác suất, chi phí và độ trễ là trục thiết kế, và mọi quyết định lớn đều kèm bằng chứng.

Kiến trúc Hệ thống

AI Engineering

Cloud & Tối ưu

6 DOMAINS · 45 NODES · 3 PROTOCOLS

Xem quỹ đạo nghề nghiệp → Kinh nghiệm

01Hệ thống được thiết kế để tồn tại lâu dài hơn cả người kiến tạo.
02Trí tuệ được tích hợp vào kiến trúc — không phải gắn thêm vào sau.
03Hạ tầng tạo ra giá trị tích lũy thay vì tích tụ nợ kỹ thuật.

4+ năm xây dựng hệ thống production

96 lệnh Rust native — Valixara cockpit (solo)

6 ngôn ngữ ship production: Python · TS · Rust · PHP · Go · SQL

3 sản phẩm độc lập đang chạy live

Bài toán đã giải quyết trong production

Những thách thức tôi thường xuyên tháo gỡ

Vài bài toán tiêu biểu — không phải tất cả. Mỗi cái đi từ chẩn đoán đến production, trên nền tư duy hệ thống áp dụng được cho bài toán tiếp theo.

Một coding agent tự động có thể 'nói dối' về việc nó vừa làm gì trên máy — chuỗi lệnh nó chạy không chứng minh được hiệu ứng thật đã xảy ra.

Thiết kế sổ cái append-only, hash-chain SHA-256, neo vào HIỆU ỨNG quan sát được (hash file sau khi ghi, delta git-HEAD mỗi lần chạy) thay vì chuỗi lệnh đã parse — vì một agent bị bypass hoàn toàn có thể khiến lệnh nói dối về việc nó làm gì.

Prototype bằng Python rồi hardened sang Rust với unit test chứng minh mọi giả mạo đều phát hiện được; mô hình trung thực 5 mức có verdict 'opaque' tường minh — hiệu ứng không suy ra được thì gắn cờ, không bao giờ âm thầm coi là an toàn.

>> kiểm toán chống giả mạo như một primitive, không phải lời khẳng định

RustTauri 2React 19SQLite (WAL)SHA-256 hash-chain

Một AI agent thu mua đồ điện tử cũ cần tự khám phá thông số nào quan trọng cho từng sản phẩm, nhưng một LLM tự do sẽ hỏi những trường bất khả thi — hỏi Face-ID cho máy chỉ có Touch-ID, hỏi tiếng quạt cho MacBook không quạt.

Kết hợp sự linh hoạt của LLM với sự thật xác định của domain: model đề xuất schema theo từng sản phẩm, rồi một bảng thông số phần cứng thủ công CẤM các trường bất khả thi. LLM được phép giải thích — code mới là thứ quyết định.

LangGraph supervisor + specialist nodes; structured output ở mọi nơi kèm retry/backoff; một cuộc điều tra P99 tail-latency thật (45s = 11.5× P50) dẫn tới pre-warm schema-cache và circuit breaker cho công cụ ngoài.

>> chỉ dữ liệu hợp lệ với thực tế phần cứng mới đi tiếp

LangGraphGemini 2.5 (multimodal)Bedrock KB RAGPostgres checkpointerHITL gating

Pipeline xử lý audio cuộc gọi nghiệp vụ thật (nhiễu, cross-talk, độ dài biến thiên) cần STT + diarization + summarization + trích xuất cấu trúc, nhưng inference nặng đồng bộ đốt GPU idle và gãy khi tải burst.

Insource Whisper + NeMo diarization lên SageMaker async endpoints do Lambda điều phối — vừa cắt phụ thuộc AI vendor bên ngoài (một lợi ích về quyền riêng tư khi dữ liệu có PII), vừa chỉ trả phí GPU khi chạy thật.

Batching trong-context (nhiều transcript mỗi lần gọi, output mảng Pydantic ≈ giảm ~80% token prompt) + prompt cache theo content-hash; coi model là không đáng tin — từ chối transcript có số lượng timestamp lệch ngoài ngưỡng cho phép.

>> không GPU idle, hấp thụ burst không cần provisioned capacity, ít vendor ngoài hơn

Whisper Large-v3NeMo diarizationSageMaker (async)BedrockGeminiS3 Tables (Iceberg)

Một harness AI review bảo mật dễ để LLM 'xác nhận' lỗi mà không có bằng chứng máy kiểm được — verdict do lời văn của LLM quyết định thì không đủ tin cậy để chặn CI.

Trung tâm là một proof-gate thuần Python tính lại MỌI verdict và loại bỏ những gì LLM đặt: một static trace SAST đơn lẻ trả về 'unconfirmable' và phải leo thang lên PoC chạy thật; một refutation luôn thắng một confirmation.

Chọn LangGraph thay vì CrewAI vì cần một decision node KHÔNG-phải-LLM; giữ LLM triage ngoài graph xác định, chỉ CONFIRMED và mặc định tắt; ép chi phí xuống mục tiêu <50k token/scan bằng cách để scanner làm phần nặng.

>> chỉ finding có bằng chứng máy-kiểm-được mới chặn được CI

LangGraphLiteLLMSemgrepTrivyGitleaksin-toto / DSSE

Lập lịch tuyến field-sales thời gian thực: một điểm dừng mới có 'chèn vừa' vào giữa hai lịch hẹn kề nhau không, khi nhiều người cùng sửa mà không được double-book?

Rút bài toán về một ràng buộc hình học conic: một điểm chỉ được gợi ý nếu nằm trong ellipse có hai tiêu điểm là hai sự kiện kề (PA + PB ≤ khoảng cách cấu hình), tô dải màu theo thời gian di chuyển great-circle.

Đồng thời thời gian thực qua Server-Sent Events với first-writer-wins; memento pattern cho undo/redo trên toàn bộ data model; đồng bộ hai chiều với Google Calendar.

>> gợi ý điểm dừng khả thi theo hình học, không double-book

Next.jsPrismaMySQLSSEconic-section constraint

Bảo vệ PII trong một data-lake dùng chung nhiều phòng ban — token không được join chéo giữa các team, và một schema bất động sản không được để PII chủ sở hữu chạm tới client.

Ép redaction PII theo cột ngay ở tầng data-lake, và pseudonymization HMAC gán phạm vi theo phòng-ban:trường:phiên-bản để token không join được across team; với bất động sản, thiết kế schema sao cho PII chủ sở hữu KHÔNG BAO GIỜ tới được client.

Quyền riêng tư là một hình dạng của kiến trúc, không phải một bộ lọc gắn thêm: fail-safe auth chặn route admin khi cấu hình sai, và một bản audit production-readiness tự viết đã chặn ship khi còn phát hiện P0.

>> quyền riêng tư được ép ở tầng schema, không thể vô tình rò rỉ

Lake Formation (column-level PII)HMAC pseudonymizationPayload CMSSupabaseS3

Technical DNA

Từ giao diện đến inference pipeline

Một stack hoàn chỉnh, đã được kiểm chứng qua môi trường production — từ frontend architecture đến tích hợp AI.

Frontend 7

React 19Next.jsTypeScriptTailwindCSSTauri 2 (desktop)Vue.jsAstro

Backend 9

Node.jsNestJSExpressFastAPIFlaskLaravelRustGoSSE

Cloud/DevOps 7

AWS (Lambda, SAM, SageMaker, DynamoDB, EventBridge, S3, Bedrock, Cognito)TerraformECS / FargateGitHub OIDCDockerCI/CDCloudFront / WAF

AI / ML 9

LangGraphMulti-Agent SystemsRAG (pgvector / HNSW)Claude / BedrockGemini (multimodal)Whisper + NeMoFlorence-2 / BiRefNetStructured output (Pydantic / Zod)Prompt caching

Practices 7

Deterministic guardrailsEvent-Driven ArchitectureCost & latency optimizationDevSecOpsObservability (X-Ray / CloudWatch)ADR / decision rigorLeast-privilege & data classification

45 kỹ năng trên 5 lĩnh vực

Hướng đi hiện tại

Valixara — Verifiable AI Ship primitive lõi của Valixara: một sổ cái hành động chống giả mạo và một Project-Intelligence OS có audit trail bất biến.

Xem lộ trình chi tiết →

Quỹ đạo nghề nghiệp

13 mốc quan trọng · Một quỹ đạo liên tục

Khám phá hành trình →

Viết lách

Bài viết mới nhất

Xem tất cả →

2026-06-22 · 4 phút đọc Sự Thật Ít Ai Nói Về AI: Huấn Luyện Model Chỉ Chiếm 2% Công Việc ML Nhiều người nghĩ làm AI chủ yếu là train model trên GPU. Thực tế huấn luyện chỉ ~2% — phần lớn thời gian nằm ở ontology, data cleaning và evaluation ML. 2026-06-19 · 7 phút đọc Tự Host Open-Source LLM Cho AI Agent: Trade-off Chi Phí, Kiểm Soát và Độ Tin Cậy GLM-5.2, DeepSeek-V4, MiniMax-M3 giờ cạnh tranh agentic. Khi nào tự host tiết kiệm hơn API và những chi phí ẩn hay bị bỏ qua khi xây production agent. 2026-06-18 · 8 phút đọc AWS DevOps Agent: Review Code Sinh Bởi AI Trước Release – Trade-off Thực Tế AWS DevOps Agent thêm review và test tự động cho code sinh bởi AI. Phân tích giá trị và trade-off áp dụng vào pipeline release thực tế.

Tech radar

Tin công nghệ được Grok tổng hợp

Xem tất cả →

2026-06-22 Chính quyền Mỹ buộc Anthropic gỡ Claude Fable 5/Mythos 5 vì export control Chính quyền Mỹ buộc Anthropic gỡ Claude Fable 5/Mythos 5 vì lệnh export control; báo cáo liên quan jailbreak guardrail. Cybersecurity experts ký thư phản đối, cho rằng gỡ model làm yếu phòng thủ mạng. Góc nhìn: Policy và perception đang quyết định model availability nhiều hơn benchmark — team cần multi-vendor fallback, không single-provider.

2026-06-22 Robotaxi index: Baidu dẫn đầu, Waymo recall 4000 xe vì construction zone Autnmy AI Road to Autonomy Index: Baidu Apollo Go dẫn robotaxi, Waymo #2, Pony.ai/WeRide tiếp theo; cập nhật 12h từ dữ liệu công khai. Đồng thời Waymo recall ~4000 xe vì lao vào khu construction highway, fix chưa xong. Góc nhìn: Bảng xếp hạng scale ≠ safety — mở rộng nhanh mà edge case chưa fix là rủi ro vận hành thật.

2026-06-22 iOS 27: Apple Intelligence nhúng vào workflow thực, không chỉ Siri chat iOS 27 nhúng Apple Intelligence vào app sẵn có: chia bill qua ảnh hóa đơn, tự đổi password bị breach, gợi ý Messages/Calendar, vibe-coding Shortcuts. Siri AI vẫn headline nhưng giá trị thực nằm ở tác vụ ngầm on-device. Góc nhìn: Consumer AI thắng bằng workflow nhỏ, không chatbot — lesson cho B2B agent: giảm friction, không thêm UI.

2026-06-22 sqlite-utils 4.0rc1: migrations và nested transactions cho SQLite production sqlite-utils 4.0rc1 (21/6): migrations tích hợp sqlite-migrate, db.atomic() nested transaction, breaking changes upsert/view API. Simon Willison kêu gọi test trước stable. Góc nhìn: Tooling SQLite production-grade giúp agent/RAG lưu state nhẹ mà không phụ thuộc DB nặng — đúng hướng cho pipeline dữ liệu nhỏ, idempotent.