VoiceFlow

Hướng Dẫn Sử Dụng

Ứng dụng chuyển đổi giọng nói tiếng Anh thành văn bản và dịch sang tiếng Việt, sử dụng Whisper AI và Google Translator.

Tính Năng

Nhận Dạng Giọng Nói

Chuyển đổi file âm thanh tiếng Anh thành văn bản với Whisper AI

Dịch Tự Động

Dịch văn bản sang tiếng Việt với Google Translator

Đa Định Dạng

Hỗ trợ MP3, WAV, M4A, MP4, AAC, FLAC, OGG (tối đa 100MB)

Quản Lý Phiên

Mỗi phiên có URL riêng để dễ dàng quay lại

Hướng Dẫn Sử Dụng

1

Chọn File Âm Thanh

Nhấn nút "Chọn file âm thanh" hoặc kéo thả file vào vùng upload. Hỗ trợ các định dạng MP3, WAV, M4A, MP4, AAC, FLAC, OGG với kích thước tối đa 100MB.

Mẹo: Chất lượng âm thanh tốt và giọng nói rõ ràng sẽ cho kết quả chính xác hơn.
2

Theo Dõi Quá Trình Xử Lý

Sau khi chọn file, hệ thống tự động xử lý. Bạn sẽ thấy:

  • Icon loading xoay vòng hiển thị quá trình đang diễn ra
  • Thanh tiến trình hiển thị phần trăm hoàn thành
  • Thông tin chi tiết: kích thước file, thời gian, tốc độ xử lý
3

Xem Kết Quả

Sau khi xử lý xong, bạn có thể:

  • Nghe lại audio với tính năng highlight từ đang phát
  • Copy văn bản (icon đổi thành checkmark khi thành công)
  • Download kết quả dưới dạng file TXT
  • Nhấn "Dịch ngay" để chuyển sang tiếng Việt
4

Quản Lý Phiên

Mỗi lần xử lý tạo một phiên với URL riêng (ví dụ: http://127.0.0.1:5000/abc123).

Thử lại: Xử lý lại file đã upload mà không cần tải lên lại

Chọn file khác: Reload trang để bắt đầu phiên mới

API Endpoints

GET / Giao diện chính
GET /<session_id> Truy cập phiên cụ thể
POST /upload Upload và nhận dạng file
POST /translate Dịch văn bản
POST /retry Thử lại xử lý
GET /api/session/<session_id> Lấy thông tin phiên

Xử Lý Sự Cố

Loading spinner không xoay

Thử các cách sau:

  • Refresh lại trang (F5)
  • Xóa cache trình duyệt
  • Thử trình duyệt khác
Lỗi "No audio file provided"

Kiểm tra:

  • Thư mục uploads/ có file không
  • File session trong sessions/
  • Thử upload lại thay vì dùng Thử lại
Kết quả không chính xác

Cải thiện độ chính xác:

  • Sử dụng file âm thanh chất lượng cao, ít nhiễu
  • Giọng nói rõ ràng, chuẩn
  • Thử model lớn hơn trong CLI mode

Bảo Mật

Chạy Local

Không gửi dữ liệu ra ngoài

Lưu Trữ Cục Bộ

File lưu trên máy bạn

Không Thu Thập

Không tracking hay analytics

Toàn Quyền

Bạn quản lý dữ liệu của mình