Ho Chi Minh City, Vietnam

Đỗ Xuân Lộc

AI & System Optimization Engineer

Phát triển từ Full-Stack đến kiến trúc AI & Cloud — tập trung thiết kế các hệ thống thực tiễn, có khả năng mở rộng và tối ưu chi phí cho thị trường Nhật Bản.

  • Kiến trúc Hệ thống Microservices · Event-driven · Phân tán
  • AI Engineering RAG · LLM · Voice AI → production
  • Cloud & Tối ưu AWS-native · Cost-first · IaC end-to-end
Full-stack to AI the complete stack 42+ tools

Every layer from UI to inference pipeline, hardened through production.

UI · DX
  • React / Next.js
  • TypeScript
  • Tailwind · Astro
  • Realtime (SSE, WS)
Backend · API
  • NestJS · Node.js
  • NX Monorepo
  • Event-driven
  • Microservices · SOLID
Cloud · Infra
  • AWS (ECS, Lambda)
  • SAM · CloudFormation
  • CI/CD pipelines
  • Docker · DevOps
AI · ML
  • RAG · Embeddings
  • LLM (Claude, Ollama)
  • Voice AI (Whisper)
  • Fine-tuning (LoRA)
  • 01Hệ thống xây để vượt qua người kiến tạo nó.
  • 02AI dệt vào kiến trúc — không phải gắn thêm vào.
  • 03Hạ tầng hoàn vốn bằng chính hiệu năng của nó.

Bài toán tôi đập tan

Sinh ra để giải quyết cái này

Thử thách thật, cách tiếp cận thật — mỗi card là một trận đánh đã hệ thống hoá.

01

Nâng cao khả năng mở rộng và bảo trì hệ thống

Chuyển đổi sang kiến trúc microservices với NX Monorepo, xác định ranh giới API rõ ràng và tự động hóa quy trình CI/CD theo từng môi trường.

NestJSNX MonorepoAWSCI/CD
02

Đồng bộ và xử lý dữ liệu đa nguồn theo thời gian thực

Áp dụng kiến trúc event-driven và serverless để giảm thiểu sự phụ thuộc giữa các dịch vụ, đảm bảo luồng dữ liệu hoạt động ổn định.

AWS LambdaEventBridgeSAMSQS
03

Ứng dụng LLM vào sản phẩm đảm bảo độ chính xác và bảo mật

Sử dụng kiến trúc RAG kết hợp embeddings để trích xuất thông tin từ tài liệu nội bộ, triển khai LLM cục bộ để kiểm soát hoàn toàn dữ liệu.

RAGEmbeddingsLLM (Ollama)Python
04

Xử lý giọng nói tiếng Nhật với các luồng hội thoại phức tạp

Tích hợp Amazon Connect, Lex V2 và Bedrock Claude Haiku để bóc tách ý định người dùng, xử lý các trường hợp nhiễu âm hoặc gián đoạn.

Amazon ConnectLex V2BedrockState Machine

Tech DNA

Full-stack tới AI — toàn bộ stack

Từng lớp từ UI đến inference pipeline, tôi luyện qua production.

Frontend 8
ReactJSNext.jsReduxTailwindCSSVueJSVuexVuetifyTypeScript
Backend 6
Node.jsNestJSExpressSocket.ioSSEThree.js
Cloud/DevOps 6
AWS (EC2, ECS, Lambda, SAM, SQS, SNS, EventBridge, ECR, CodePipeline, SageMaker, Bedrock)DockerGitHub ActionsNX MonorepoCI/CDCloudFormation
AI / ML 9
RAGWord2Vec / EmbeddingsLLM (Ollama, Claude, Gemini)Fine-tuning (LoRA/QLoRA)Whisper + PyannoteFlorence-2LangGraphMulti-Agent SystemsAI Pipelines
Practices 8
MicroservicesEvent-Driven ArchitectureDevSecOpsFeature-Based DesignSOLID PrinciplesMonitoring & ObservabilityBusiness IntelligenceCost Optimization

42 kỹ năng trên 5 lĩnh vực

Nhiệm vụ hiện tại
AI Core Implementation Tập trung áp dụng AI vào giải quyết các bài toán nghiệp vụ, ưu tiên tính ổn định của hệ thống.
Xem lộ trình đầy đủ →

Trajectory // Roadmap

Lộ trình tương lai

Từ lõi AI hôm nay đến tầm nhìn xa — nơi mình đang phóng tới.

01
2026 Đang thực hiện
AI Core Implementation

Tập trung áp dụng AI vào giải quyết các bài toán nghiệp vụ, ưu tiên tính ổn định của hệ thống.

Production RAGLLM optimizationObservabilityInference tuning
02
2026–2027 Kế hoạch
Systems at Scale

Nghiên cứu các phương án mở rộng năng lực xử lý của hệ thống AI, cân bằng giữa hiệu năng và chi phí.

Distributed inferenceMLOpsServerless AIAuto-scaling
03
2027–2028 Kế hoạch
DevSecOps & Compliance

Tăng cường các tiêu chuẩn bảo mật, quản trị rủi ro và tối ưu hóa tài nguyên đám mây.

Zero-trust AISecure CI/CDCloud cost controlCompliance
04
2028–2030 Kế hoạch
Solutions Architecture

Phát triển năng lực thiết kế tổng thể, định hình các giải pháp công nghệ đáp ứng tiêu chuẩn doanh nghiệp.

Enterprise RAGAgent orchestrationPlatform architectureAI governance
05
2030+ Kế hoạch
Cross-Border Engineering

Trau dồi ngoại ngữ (N3+) và kỹ năng quản lý để làm việc hiệu quả hơn trong môi trường quốc tế.

Japanese N3+Cross-border teamsAI ethicsThought leadership

Tech radar

Tin công nghệ Grok cập nhật

Tất cả ↗
2026-06-06 Dữ liệu ETR: adoption AI enterprise chuyển dịch mạnh, Claude tăng gấp đôi Theo khảo sát Enterprise Technology Research được WSJ trích dẫn, Claude tăng từ 21% lên 48% share trong enterprise (dẫn đầu tốc độ), Gemini tăng đáng kể, OpenAI giảm nhẹ lần đầu tiên. Đa mô hình trở thành mặc định mới và coding assistants là động lực kéo revenue cho các nhà cung cấp LLM.
2026-06-06 Kubernetes 1.35 đưa In-Place Pod Resize lên stable cho VPA Tính năng resize CPU và memory của container trong Pod đang chạy mà không cần restart hay eviction đã chính thức ổn định. Giúp Vertical Pod Autoscaler hiệu quả hơn với stateful workloads, long-running services và các kịch bản cần điều chỉnh tài nguyên linh hoạt mà không gây downtime hay mất state.
2026-06-06 Anthropic gọi vốn 65 tỷ USD, valuation đạt 965 tỷ USD vượt OpenAI Vòng Series H do Altimeter, Dragoneer, Greenoaks và Sequoia dẫn dắt đẩy Anthropic lên vị trí AI startup có giá trị cao nhất. Doanh thu run-rate vượt 47 tỷ USD, tập trung mở rộng compute và enterprise adoption. Coding assistants được chỉ ra là động lực tăng trưởng chính cho các frontier model.
2026-06-06 AWS Lambda Managed Instances kết hợp serverless với linh hoạt của EC2 Tính năng cho phép chạy Lambda functions trên EC2 instances do AWS quản lý hoàn toàn trong tài khoản của bạn. Giữ nguyên DX serverless, event integrations, nhưng cho phép chọn instance types chuyên biệt, áp dụng Savings Plans/Reserved Instances và sử dụng multi-concurrency để tối ưu tài nguyên cho workload ổn định. Vừa hỗ trợ scheduled scaling qua EventBridge.