Tối ưu hóa tìm kiếm mã nguồn Claude Code với Semble MCP — Cơ chế giảm 98% token và hướng dẫn thực tế

Tối ưu hóa tìm kiếm mã nguồn Claude Code với Semble MCP — Cơ chế giảm 98% token và hướng dẫn thực tế

Tối ưu hóa tìm kiếm mã nguồn Claude Code với Semble MCP — Cơ chế giảm 98% token và hướng dẫn thực tế

Semble MCP là gì?

Semble MCP là máy chủ tìm kiếm mã nguồn cục bộ tốc độ cao được thiết kế đặc biệt cho các AI agent lập trình. Mục đích là cung cấp cho các agent như Claude Code, Cursor và OpenAI Codex "khám phá mã thông minh hơn grep và nhẹ hơn RAG".

Thông thường, một AI agent kết hợp grep, ripgrep, đọc toàn bộ file và tìm kiếm embeddings khi tìm kiếm mã; Semble tối ưu hóa quá trình đó một cách chuyên biệt.

"Xử lý xác thực ở đâu?"
"Triển khai save model"
"Khởi tạo Firebase"

Với tìm kiếm ngôn ngữ tự nhiên như vậy, chỉ trả về nhanh chóng các đoạn mã cần thiết.


Tính năng chính

Xử lý cục bộ siêu nhanh

Semble hoạt động chỉ với CPU. Không cần GPU.

  • Tạo chỉ mục repository: khoảng 250ms
  • Tìm kiếm: khoảng 1.5ms

Giảm đáng kể việc sử dụng token

So với "grep + đọc file", có thể truy cập mã cần thiết với ít hơn 98% token. Khi vận hành Claude Code trong thời gian dài trên các dự án lớn, tác động giảm chi phí rất đáng kể.

Bảo mật: thiết kế hoàn toàn cục bộ

Mô tả chính thức nhấn mạnh:

  • Không cần khóa API
  • Không có giao tiếp với dịch vụ bên ngoài
  • Hoạt động hoàn toàn qua đường dẫn cục bộ

Tạo chỉ mục, tìm kiếm, tạo embeddings và tìm kiếm BM25 đều được xử lý trong PC cục bộ.


Cách thêm vào Claude Code

Cần có uv. Có thể thêm bằng lệnh sau:

claude mcp add semble -s user -- uvx --from "semble[mcp]" semble

Khi cài đặt lấy gói từ PyPI, nhưng các hoạt động sau đó chạy hoàn toàn cục bộ.


Kết hợp với Sub-agent

Ngoài phiên bản MCP, Semble còn có phiên bản CLI. Vì Sub-agent của Claude Code có thể không sử dụng được MCP trong một số trường hợp, nên ghi rõ việc sử dụng phiên bản CLI trong CLAUDE.md hoặc AGENTS.md.

Use `semble search` instead of grep for codebase exploration.

Bằng cách viết như vậy, nhiều agent sẽ sử dụng Semble một cách nhất quán.

Cách sử dụng thực tế

# Tìm kiếm ngôn ngữ tự nhiên
semble search "authentication flow" ./my-project
semble search "Firebase initialization" ./my-project
semble search "query submission process" ./my-project --top-k 10

# Khám phá mã liên quan (chỉ định đường dẫn file và số dòng)
semble find-related src/auth.py 42 ./my-project

Phân chia vai trò với các công cụ khác

Semble chỉ là công cụ chuyên biệt về tìm kiếm mã. Điều quan trọng là hiểu sự phân chia vai trò với các MCP khác.

Công cụ Vai trò
Semble Tìm kiếm trong mã của bạn
context7 Lấy tài liệu chính thức của thư viện
filesystem MCP Đọc và ghi file
git MCP Thao tác Git

Cụ thể:

  • context7 → "Muốn biết thông số kỹ thuật chính thức của Jetpack Compose"
  • Semble → "Muốn tìm kiếm mã Compose trong dự án của mình"

Build, lint, chạy test và thao tác DB nằm ngoài phạm vi của Semble.


Phù hợp với loại dự án nào?

Trường hợp hiệu quả nhất

  • Repository khổng lồ
  • Dự án Android (Jetpack Compose, Firebase hỗn hợp, cấu trúc multi-module)
  • Sử dụng nhiều Sub-agent với vận hành AGENTS.md
  • Sử dụng Claude Code lâu dài và liên tục

Trường hợp không cần thiết lắm

  • Repository nhỏ (vài file)
  • Công việc một lần

Lưu ý bảo mật

Mặc dù bản thân Semble có thiết kế hoàn toàn cục bộ, nhưng có một số điểm cần chú ý khi sử dụng.

Kết quả tìm kiếm được chuyển đến LLM

Semble không gửi mã ra ngoài, nhưng kết quả tìm kiếm mà nó trả về được chuyển đến LLM qua Claude Code.

Mã cục bộ
  ↓ Tìm kiếm Semble (hoàn toàn cục bộ)
  ↓ Chuyển kết quả tìm kiếm đến Claude
  ↓ LLM xử lý

Tức là, cần xem xét việc gửi đến LLM, không phải bản thân Semble.

Ví dụ cấu hình an toàn

Nếu bảo mật là ưu tiên, nên dùng cấu hình tối thiểu hóa MCP có giao tiếp bên ngoài.

Claude Code
├ Semble (local)
├ filesystem MCP (local)
├ git MCP (local)
└ terminal (local)

Khi xử lý mã bí mật hoặc dữ liệu doanh nghiệp, việc kiểm tra chính sách telemetry và lưu giữ hội thoại ở phía LLM quan trọng hơn bản thân Semble.


Tóm tắt

Semble MCP là công cụ có giá trị cao cho các kỹ sư sử dụng Claude Code một cách chuyên nghiệp.

  • Giảm đáng kể chi phí token (tối đa 98%)
  • Tìm kiếm mã bằng ngôn ngữ tự nhiên
  • An toàn với thiết kế hoàn toàn cục bộ
  • Hiệu quả nhân đôi khi kết hợp với Sub-agent

Chỉ cần thay thế các phần quét nhiều file bằng grep bằng Semble là hiệu quả hoạt động của agent thay đổi đáng kể. Đặc biệt trong các dự án lớn và cấu hình đa agent, đáng xem xét việc áp dụng sớm.