Tối ưu hóa tìm kiếm mã nguồn Claude Code với Semble MCP — Cơ chế giảm 98% token và hướng dẫn thực tế
Semble MCP là gì?
Semble MCP là máy chủ tìm kiếm mã nguồn cục bộ tốc độ cao được thiết kế đặc biệt cho các AI agent lập trình. Mục đích là cung cấp cho các agent như Claude Code, Cursor và OpenAI Codex "khám phá mã thông minh hơn grep và nhẹ hơn RAG".
Thông thường, một AI agent kết hợp grep, ripgrep, đọc toàn bộ file và tìm kiếm embeddings khi tìm kiếm mã; Semble tối ưu hóa quá trình đó một cách chuyên biệt.
"Xử lý xác thực ở đâu?"
"Triển khai save model"
"Khởi tạo Firebase"
Với tìm kiếm ngôn ngữ tự nhiên như vậy, chỉ trả về nhanh chóng các đoạn mã cần thiết.
Tính năng chính
Xử lý cục bộ siêu nhanh
Semble hoạt động chỉ với CPU. Không cần GPU.
- Tạo chỉ mục repository: khoảng 250ms
- Tìm kiếm: khoảng 1.5ms
Giảm đáng kể việc sử dụng token
So với "grep + đọc file", có thể truy cập mã cần thiết với ít hơn 98% token. Khi vận hành Claude Code trong thời gian dài trên các dự án lớn, tác động giảm chi phí rất đáng kể.
Bảo mật: thiết kế hoàn toàn cục bộ
Mô tả chính thức nhấn mạnh:
- Không cần khóa API
- Không có giao tiếp với dịch vụ bên ngoài
- Hoạt động hoàn toàn qua đường dẫn cục bộ
Tạo chỉ mục, tìm kiếm, tạo embeddings và tìm kiếm BM25 đều được xử lý trong PC cục bộ.
Cách thêm vào Claude Code
Cần có uv. Có thể thêm bằng lệnh sau:
claude mcp add semble -s user -- uvx --from "semble[mcp]" semble
Khi cài đặt lấy gói từ PyPI, nhưng các hoạt động sau đó chạy hoàn toàn cục bộ.
Kết hợp với Sub-agent
Ngoài phiên bản MCP, Semble còn có phiên bản CLI. Vì Sub-agent của Claude Code có thể không sử dụng được MCP trong một số trường hợp, nên ghi rõ việc sử dụng phiên bản CLI trong CLAUDE.md hoặc AGENTS.md.
Use `semble search` instead of grep for codebase exploration.
Bằng cách viết như vậy, nhiều agent sẽ sử dụng Semble một cách nhất quán.
Cách sử dụng thực tế
# Tìm kiếm ngôn ngữ tự nhiên
semble search "authentication flow" ./my-project
semble search "Firebase initialization" ./my-project
semble search "query submission process" ./my-project --top-k 10
# Khám phá mã liên quan (chỉ định đường dẫn file và số dòng)
semble find-related src/auth.py 42 ./my-project
Phân chia vai trò với các công cụ khác
Semble chỉ là công cụ chuyên biệt về tìm kiếm mã. Điều quan trọng là hiểu sự phân chia vai trò với các MCP khác.
| Công cụ | Vai trò |
|---|---|
| Semble | Tìm kiếm trong mã của bạn |
| context7 | Lấy tài liệu chính thức của thư viện |
| filesystem MCP | Đọc và ghi file |
| git MCP | Thao tác Git |
Cụ thể:
- context7 → "Muốn biết thông số kỹ thuật chính thức của Jetpack Compose"
- Semble → "Muốn tìm kiếm mã Compose trong dự án của mình"
Build, lint, chạy test và thao tác DB nằm ngoài phạm vi của Semble.
Phù hợp với loại dự án nào?
Trường hợp hiệu quả nhất
- Repository khổng lồ
- Dự án Android (Jetpack Compose, Firebase hỗn hợp, cấu trúc multi-module)
- Sử dụng nhiều Sub-agent với vận hành AGENTS.md
- Sử dụng Claude Code lâu dài và liên tục
Trường hợp không cần thiết lắm
- Repository nhỏ (vài file)
- Công việc một lần
Lưu ý bảo mật
Mặc dù bản thân Semble có thiết kế hoàn toàn cục bộ, nhưng có một số điểm cần chú ý khi sử dụng.
Kết quả tìm kiếm được chuyển đến LLM
Semble không gửi mã ra ngoài, nhưng kết quả tìm kiếm mà nó trả về được chuyển đến LLM qua Claude Code.
Mã cục bộ
↓ Tìm kiếm Semble (hoàn toàn cục bộ)
↓ Chuyển kết quả tìm kiếm đến Claude
↓ LLM xử lý
Tức là, cần xem xét việc gửi đến LLM, không phải bản thân Semble.
Ví dụ cấu hình an toàn
Nếu bảo mật là ưu tiên, nên dùng cấu hình tối thiểu hóa MCP có giao tiếp bên ngoài.
Claude Code
├ Semble (local)
├ filesystem MCP (local)
├ git MCP (local)
└ terminal (local)
Khi xử lý mã bí mật hoặc dữ liệu doanh nghiệp, việc kiểm tra chính sách telemetry và lưu giữ hội thoại ở phía LLM quan trọng hơn bản thân Semble.
Tóm tắt
Semble MCP là công cụ có giá trị cao cho các kỹ sư sử dụng Claude Code một cách chuyên nghiệp.
- Giảm đáng kể chi phí token (tối đa 98%)
- Tìm kiếm mã bằng ngôn ngữ tự nhiên
- An toàn với thiết kế hoàn toàn cục bộ
- Hiệu quả nhân đôi khi kết hợp với Sub-agent
Chỉ cần thay thế các phần quét nhiều file bằng grep bằng Semble là hiệu quả hoạt động của agent thay đổi đáng kể. Đặc biệt trong các dự án lớn và cấu hình đa agent, đáng xem xét việc áp dụng sớm.