Tính Năng
Nhận Dạng Giọng Nói
Chuyển đổi file âm thanh tiếng Anh thành văn bản với Whisper AI
Dịch Tự Động
Dịch văn bản sang tiếng Việt với Google Translator
Đa Định Dạng
Hỗ trợ MP3, WAV, M4A, MP4, AAC, FLAC, OGG (tối đa 100MB)
Quản Lý Phiên
Mỗi phiên có URL riêng để dễ dàng quay lại
Hướng Dẫn Sử Dụng
Chọn File Âm Thanh
Nhấn nút "Chọn file âm thanh" hoặc kéo thả file vào vùng upload. Hỗ trợ các định dạng MP3, WAV, M4A, MP4, AAC, FLAC, OGG với kích thước tối đa 100MB.
Theo Dõi Quá Trình Xử Lý
Sau khi chọn file, hệ thống tự động xử lý. Bạn sẽ thấy:
- Icon loading xoay vòng hiển thị quá trình đang diễn ra
- Thanh tiến trình hiển thị phần trăm hoàn thành
- Thông tin chi tiết: kích thước file, thời gian, tốc độ xử lý
Xem Kết Quả
Sau khi xử lý xong, bạn có thể:
- Nghe lại audio với tính năng highlight từ đang phát
- Copy văn bản (icon đổi thành checkmark khi thành công)
- Download kết quả dưới dạng file TXT
- Nhấn "Dịch ngay" để chuyển sang tiếng Việt
Quản Lý Phiên
Mỗi lần xử lý tạo một phiên với URL riêng (ví dụ: http://127.0.0.1:5000/abc123).
Thử lại: Xử lý lại file đã upload mà không cần tải lên lại
Chọn file khác: Reload trang để bắt đầu phiên mới
API Endpoints
/
Giao diện chính
/<session_id>
Truy cập phiên cụ thể
/upload
Upload và nhận dạng file
/translate
Dịch văn bản
/retry
Thử lại xử lý
/api/session/<session_id>
Lấy thông tin phiên
Xử Lý Sự Cố
Loading spinner không xoay
Thử các cách sau:
- Refresh lại trang (F5)
- Xóa cache trình duyệt
- Thử trình duyệt khác
Lỗi "No audio file provided"
Kiểm tra:
- Thư mục
uploads/có file không - File session trong
sessions/ - Thử upload lại thay vì dùng Thử lại
Kết quả không chính xác
Cải thiện độ chính xác:
- Sử dụng file âm thanh chất lượng cao, ít nhiễu
- Giọng nói rõ ràng, chuẩn
- Thử model lớn hơn trong CLI mode
Bảo Mật
Chạy Local
Không gửi dữ liệu ra ngoài
Lưu Trữ Cục Bộ
File lưu trên máy bạn
Không Thu Thập
Không tracking hay analytics
Toàn Quyền
Bạn quản lý dữ liệu của mình