Bot Admin Settings

Workspace 1

Tổng quan

Điểm vào chung cho bot admin.

Workspace 2

Runtime

Rotation, debug context và payload.

Workspace 4

Knowledge

Prompt và file RAG.

AI Gateway Integration

Cấu hình kết nối LLM

Bot sử dụng AI Gateway làm cổng điều phối tập trung cho tất cả các yêu cầu LLM.

Bot Chính

Xử lý hội thoại khách hàng

Telegram Bot Token Chế độ hoạt động (AI Route) Chat Model (GitHub)

Thông tin chiến lược

Kiểu xoay vòng: Đang tải...

Bộ Tóm Tắt (Summary)

Nén lịch sử hội thoại

AI Route Tóm tắt

Tùy chọn nâng cao

Ghi đè Model Cố định API Key

* Khuyên dùng Gemini cho tóm tắt vì tốc độ và giá thành tối ưu.

Hệ thống Embedding

Xử lý vector & RAG toàn diện

Provider Embedding Model Embedding

Trạng thái: Hoạt động

Embedding giúp bot hiểu ngữ cảnh sâu và tìm kiếm chính xác trong kho dữ liệu sản phẩm.

Lưu ý: Mọi tinh chỉnh về danh sách API key, tốc độ rotation và khả năng chịu tải (failover) đều được cấu hình tập trung tại đây.

QA Cache

Bộ nhớ câu hỏi - trả lời

Dùng file `llm-qa.txt` để tái sử dụng câu trả lời cũ cho các câu hỏi trùng hoặc rất giống, giúp giảm token và thời gian phản hồi.

🧠 Bật/Tắt QA Cache

Cho phép bot dùng lại câu trả lời cũ trước khi gọi LLM

Khi bật: bot sẽ kiểm tra `llm-qa.txt` trước. Nếu câu hỏi trùng hoặc rất giống, bot trả lại câu trả lời cũ và bỏ qua bước gọi LLM.

🎓 Bật/Tắt Dạy AI

Cho phép người dùng Telegram dùng các nút ghi nhớ và dạy AI

Khi bật: Telegram mới hiện các nút `Ghi nhớ(danh mục)`, `Ghi nhớ(chung)`, `Dạy AI`, `Sửa câu lưu`. Khi tắt: bot vẫn dùng QA cache để tự trả lời nếu có, nhưng không cho người dùng can thiệp ghi nhớ hay sửa dữ liệu đã lưu.

Ký tự tối thiểu

Câu khách quá ngắn hơn ngưỡng này sẽ bị bỏ qua, không check QA cache.

Ví dụ: nếu đặt `6` thì các câu như `ok`, `dạ`, `alo` sẽ bị loại sớm trước khi so khớp.

Ngưỡng giống nhau

Giá trị càng cao thì càng chặt. Khuyên dùng `0.96` để tránh match nhầm.

Ví dụ: `có sen cây vàng ko em` và `có sen cây màu vàng không em` có thể được xem là gần giống nhau nếu vượt ngưỡng này.

Semantic Embedding

So khớp theo nghĩa khi câu hỏi khác wording nhưng cùng ý.

Ngưỡng embedding

Cosine similarity tối thiểu để coi là cùng ý. Khuyên dùng `0.88`.

Top K Embedding (cho Rerank) 5

1số câu hỏi gửi LLM duyệt20

Embedding lấy Top K câu hỏi tương đồng nhất, rồi LLM Rerank sẽ kiểm tra từng cái (nếu bật rerank).

Cụm từ chặn cache

Các câu mơ hồ như `ok em`, `cảm ơn`, `chốt nhé` sẽ không dùng QA cache để tránh trả nhầm ý.

Nhập theo dạng phân cách bởi dấu phẩy. Ví dụ: `ok em, cảm ơn, chốt nhé, mẫu này đi`

🧠 LLM Rerank (Kiểm tra ngữ nghĩa)

Sau khi Embedding lấy Top K câu hỏi, LLM sẽ duyệt lại để xác nhận ý nghĩa trước khi trả kết quả.

AI Route dùng để Rerank

Khuyên dùng model nhẹ (Gemini Flash, Groq) — chỉ trả true/false nên rất nhanh.

Quy trình khi bật Rerank:
1️⃣ Embedding lấy Top K câu hỏi giống nhau nhất.
2️⃣ LLM duyệt từng câu: "Hai câu này cùng ý không?" (chỉ gửi câu hỏi, không gửi câu trả lời).
3️⃣ Trả về câu trả lời ứng với câu hỏi đầu tiên được xác nhận.
⚠️ Nếu không câu nào vượt qua, sẽ gọi LLM tư vấn bình thường.

Prompt Rerank (cho LLM)

Nhiệm vụ: Bạn là chuyên gia đối chiếu ý nghĩa câu hỏi.
** Người dùng sẽ dựa và kết quả trả về để lựa chọn câu tra lời phù hợp, mọi yếu tố sai lệch sẽ khiến câu trả lời sau đó sẽ sai lệch theo **
Dưới đây là CÂU HỎI KHÁCH và DANH SÁCH MẪU. Hãy tìm mẫu CÓ CÙNG NỘI DUNG hoặc MỤC ĐÍCH với khách.

TIÊU CHUẨN KHỚP:
1. Cùng mục đích (Ví dụ: "bạn ở đâu", "nhà em ở đâu", "cửa hàng ở đâu" -> Cùng địa chỉ -> KHỚP).
2. Cốt lõi của câu chuyện: Nếu khách hỏi chuyện mua sắm, giá cả, bớt giá nhưng câu mẫu lại nói về vấn đề có bán hay không, thì đó là KHÔNG HỀ LIÊN QUAN. Phải khác hoàn toàn.
3. KHẮT KHE VỀ THUỘC TÍNH: Nếu câu hỏi có màu sắc (Vàng, Bạc), kiểu dáng (Tròn, Vuông), chức năng (Nóng Lạnh)... thì mẫu bắt buộc phải khớp y chang thuộc tính đó. 
=> Phải xác đinh trong câu hỏi có bao nhiêu yếu tố( màu, kiểu dáng, chức năng...). Chỉ ko false khi và chỉ khi cả 2 câu đều tương đồng các yếu tố, việc thiếu, thừa phải trả về false
Trái thuộc tính là sai!
nóng lạnh # lạnh
3m khác 4m...
.. các thông số liên quan tới number phải chính xác tuyệt đối
màu sắc xám, trắng, bạc, niken mờ, bóng,.. hoàn toàn khác nhau.
không suy diễn, chỉ tin vào từ ngữ. 
nghi ngờ, lập tức loại bỏ
Ưu tiên trả về 'false' nếu không khớp

VÍ DỤ:
[Khách]: "mua 3 cái có bớt không" | [Mẫu]: 1. "có bán sen cây không" => false (Vì một bên hỏi giảm giá, một bên hỏi có hàng không).
[Khách]: "có sen cây lạnh ko" | [Mẫu]: 1. "có vòi nóng lạnh phèn ko" => false
[Khách]: "có màu trắng ko em" | [Mẫu]: 1. "Có màu trắng không?" => 1
[Khách]: "hàng đồng thau dưới 2 triệu" | [Mẫu]: 1. "mẫu inox 304 dưới 2tr" => false
[Khách]: "Có màu vàng ko" | [Mẫu]: 1. "Có màu vàng ko , anh ở đảo" => false vì câu mẫu có thêm yếu tố là ở Đảo.
```có chậu chén 1 ngăn, kích thước 80, thân chậu dày 0,8mm ko em``. mẫu: ```Có chậu 1 hộc không?```-> false vì thiếu dữ liệu thân chậu hoặc kích thước
inox, nóng lạnh, đúc liền khối. Mẫu: ```co mẫu nào dưới 2 triệu mà inox nha, nóng lạnh``` => False vì mẫu đang hỏi có thêm mức giá mà câu hỏi không có. Câu hỏi có đúc liền khối mà câu mẫu không có. 
TẤT CẢ CÁC TRƯỜNG HỢP KHÁC TƯƠNG TỰ. CHỈ TRẢ VỀ SỐ THỨ TỰ KHI CHẮC CHẮN CÂU HỎI VÀ CÂU MẪU TƯƠNG ĐỒNG về ý nghĩa, thuộc tính(không thiếu, không thừa, phải khớp nhau), NGƯỢC LẠI TRẢ VỀ false
QUY TẮC TRẢ VỀ:
- Chỉ trả về DUY NHẤT 1 SỐ THỨ TỰ.
- Trả về 'false' nếu không có mẫu nào sát ý.
- Thừa hoặc thiếu yếu tố nào đều trả về false
- Không được phép giải thích!

LLM sẽ nhận prompt này + câu hỏi của khách + câu hỏi mẫu, rồi trả đúng 1 từ: true hoặc false.

RAG & Prompt Policy

Chiến lược truy xuất & Hội thoại

📚 RAG Chung

Kiến thức tổng quát từ file TXT/MD

Top K 3

1số kết quả tối đa30

Min Score 0.30

Rộng 0.05ngưỡng tương đồngChặt 0.99

💡 Score thấp → nhiều kết quả hơn nhưng ít liên quan. Score cao → ít nhưng chính xác hơn.

🗂️ RAG Danh Mục

Dữ liệu theo catalog sản phẩm

Top K 5

1số kết quả tối đa30

Min Score 0.15

Rộng 0.05ngưỡng tương đồngChặt 0.99

💡 Thường set TopK cao hơn RAG Chung vì danh mục cụ thể hơn và nhiều thông tin liên quan hơn.

⏱️ Lịch sử & Truy vấn

Giới hạn token & tối ưu query

Max History 10

2tin nhắn tối đa gửi đi30

RAG History Num 1

1câu hỏi tạo RAG query8

RAG Pool Max Chunks Chung 3

1số chunk tối đa giữ cho RAG chung50

RAG Pool Max Chunks Danh Mục 5

1số chunk tối đa giữ cho RAG danh mục50

🔄 Inject Top N / lượt

Số chunk tốt nhất từ search được phép thay vào pool mỗi lượt hỏi

1 (chậm tích lũy)chunk được inject / lượt20 (nhanh thay)

📌 Ví dụ: Top K = 10, Max Pool = 10, Inject N = 3
→ Search lấy 10 kết quả, chỉ lấy 3 cái score cao nhất thay cho 3 cái cũ nhất trong pool.
⚠️ Inject N ≤ Max Pool để tránh xóa hết pool trong 1 lượt.

💡 RAG History Num nhỏ (1-3) để tránh nhiễu từ các câu hỏi cũ không liên quan.

🎯 Attribute-Aware Reranking

Tự cấu hình luật ưu tiên thuộc tính như màu, hình dáng, chất liệu, nhiệt độ, số đường nước.

Boost khi chunk khớp thuộc tính Penalty khi thiếu thuộc tính

Rule Text

vang, trang, den, xam, bac, niken, dong => vang, trang, den, xam, bac, niken, dong, mau
tron, vuong, chu nhat => tron, vuong, chu nhat
inox, dong thau, 304 => inox, dong thau, 304
nong lanh, lanh => nong lanh, lanh
2 duong nuoc, 3 duong nuoc => 2 duong nuoc, 3 duong nuoc
bong sen, tay sen, voi xa chau => bong sen, tay sen, voi xa chau
4m, 4.5m, 5m, 5.5m, 6m, 8m, 10m, áp lực, mạnh, yếu => 4m, 4.5m, 5m, 5.5m, 6m, 8m, 10m, bon toi thieu
gia, bao nhieu, re hon, dat hon => gia, tr, nghin, khuyen mai
tròn, vuông, chữ nhật, cn, kích thước, dài, cao, rộng, ngang => tròn, vuông, chữ nhật, cn, kích thước, dài, cao, rộng, ngang
hộc, hố, ngăn => hộc, hố, ngăn
lap am, lap noi, am, duong => lap am, lap noi, am, duong
xuoc, chong xuoc, bong, mo, hairline, niken mo => xuoc, chong xuoc, bong, mo, hairline, niken mo
khoa nhiet do, hien thi nhiet do, phim dan, cam ung, rut day, xoay 360 => khoa nhiet do, hien thi nhiet do, phim dan, cam ung, rut day, xoay 360
nuoc phen, nuoc gieng, nuoc man, nuoc may => nuoc phen, nuoc gieng, nuoc man, nuoc may
1 hoc, 2 hoc, 1 ho, 2 ho, 1 ngan, 2 ngan => 1 hoc, 2 hoc, 1 ho, 2 ho, 1 ngan, 2 ngan
60, 68, 75, 78, 80, 82, 90, 100, 120 => 60, 68, 75, 78, 80, 82, 90, 100, 120
bong tron, bong vuong, bong chu nhat => bong tron, bong vuong, bong chu nhat
co voi, kem voi, khong voi => co voi, kem voi, khong voi

Dùng dạng dễ nhất, mỗi dòng 1 rule: `term_query_1, term_query_2 => term_chunk_1, term_chunk_2` Ví dụ: `vang, trang => vang, trang, mau` Hệ thống tự chuyển về chữ thường và bỏ dấu khi so khớp, nên bạn có thể nhập không dấu cho dễ: `vang, trang, nong lanh => vang, trang, nóng lạnh` Nghĩa là khách hỏi `vàng`, `trắng`, `nóng lạnh` thì vẫn khớp bình thường.

Ví dụ sẵn dùng

vang, trang, den, xam, bac, niken, dong => vang, trang, den, xam, bac, niken, dong, mau
tron, vuong, chu nhat => tron, vuong, chu nhat
inox, dong thau, 304 => inox, dong thau, 304
nong lanh, lanh => nong lanh, lanh
2 duong nuoc, 3 duong nuoc => 2 duong nuoc, 3 duong nuoc
bong sen, tay sen, voi xa chau => bong sen, tay sen, voi xa chau
4m, 4.5m, 5m, 5.5m, 6m, 8m, 10m => 4m, 4.5m, 5m, 5.5m, 6m, 8m, 10m, bon toi thieu
gia, bao nhieu, re hon, dat hon => gia, tr, nghin, khuyen mai

🤖 LLM Rewrite Query

Dùng AI tối ưu lại câu query RAG trước khi tìm kiếm

🏊 RAG Context Pool

Lưu trữ & tái sử dụng các chunk RAG quan trọng vào system prompt

🔍 Regex Guard

Chỉ gọi AI phân loại khi Regex không tìm thấy danh mục

📄 Prompt Danh Mục

Dùng prompt file riêng cho từng loại sản phẩm

🏷️ SKU Injection

Chèn thuộc tính chi tiết sản phẩm vào prompt

📋 Prompt Mode

Danh mục nào đưa vào System Prompt

🏷️ Chế độ Inject SKU

Từ khoá kích hoạt chế độ "Chỉ định":

Phân cách bằng dấu phẩy. Bot sẽ chỉ lấy thông tin SKU khi chat có từ khoá này.

🏷️ SKU Limits

Max items

Max attrs

Cấu hình Prompt: 🤖 LLM Rewrite Query

Tính năng này chỉ có hiệu lực khi mục "🤖 LLM Rewrite Query" phía trên được bật. Prompt hỗ trợ markdown và text thuần.

Cấu hình Prompt: ⏱️ Summary (Tóm tắt lịch sử)

Prompt này được dùng khi số lượng tin nhắn vượt quá "Max History". LLM sẽ dùng prompt này để nén lịch sử cũ thành 1 đoạn văn.

AI Logic Extensions

Tính năng AI mở rộng (AI Functions)

Kích hoạt các module logic AI chuyên biệt để hỗ trợ xử lý yêu cầu phức tạp.

ContentGenerator

Hàm AI chuyên dùng để tạo nội dung văn bản (bài viết, mô tả sản phẩm...)

Đang tắt

ProductDescriptionHelper

Hàm AI chuyên dùng để sửa hoặc tối ưu hóa mô tả sản phẩm.

Đang tắt

Lưu ý về hiệu năng: Việc kích hoạt quá nhiều AI Functions cùng lúc có thể làm tăng chi phí token và thời gian phản hồi của bot. Hãy chọn những tính năng thực sự cần thiết cho kịch bản của bạn.