Giới thiệu về Whisper Service
Whisper service, dựa trên Whisper của OpenAI, là một yếu tố thay đổi cuộc chơi để xây dựng các quy trình xử lý dựa trên nhận dạng giọng nói hoặc các dịch vụ phiên âm. Trong bài viết này, chúng ta sẽ khám phá cách thiết lập một Whisper service và tạo một giao diện web cho nó.
Tổng quan về Whisper
Introduction to Whisper Service
Whisper là một khởi đầu tuyệt vời để xây dựng một quy trình xử lý dựa trên nhận dạng giọng nói hoặc dịch vụ phiên âm. Nó có thể được sử dụng để tạo phụ đề cho nội dung dạng ngắn và mọi thứ được thực hiện cục bộ và có thể tự lưu trữ, ngay cả trên phần cứng cũ.
Thiết lập Whisper Service
Setting Up Whisper Service
Để thiết lập Whisper service, chúng ta cần nhân bản kho lưu trữ GitHub và tạo một môi trường ảo Python. Sau đó, chúng ta sẽ cài đặt các dependencies cần thiết và khởi chạy script ứng dụng.
Tạo Môi Trường Ảo Python
Creating a Python Virtual Environment
Chúng ta cần tạo một môi trường ảo Python để cài đặt các dependencies cần thiết. Chúng ta có thể sử dụng bất kỳ phiên bản Python 3 nào từ 3.8 đến 3.11.
Cài Đặt Dependencies
Chúng ta cần cài đặt các dependencies cần thiết, bao gồm python-dotenv
và ffmpeg
. Chúng ta có thể cài đặt chúng bằng apt
.
Khởi Chạy App Script
Launching the App Script
Chúng ta có thể khởi chạy script ứng dụng bằng cách thực thi tệp
app.py
. Thao tác này sẽ khởi động Whisper service.
Kiểm Tra Whisper Service
Testing the Whisper Service
Chúng ta có thể kiểm tra Whisper service bằng cách gửi một tệp âm thanh đến service bằng lệnh
curl
.
Tạo Giao Diện Web
Creating a Web Interface
Chúng ta có thể tạo một giao diện web cho Whisper service bằng một project riêng biệt. Chúng ta sẽ sử dụng
flask
để tạo giao diện web.
Định Cấu Hình Giao Diện Web
Configuring the Web Interface
Chúng ta cần định cấu hình giao diện web bằng cách đặt các biến
SECRET_KEY
và REST_ENDPOINT
.
Bắt Đầu Giao Diện Web
Starting the Web Interface
Chúng ta có thể khởi động giao diện web bằng cách thực thi tệp
app.py
.
Kiểm Tra Giao Diện Web
Testing the Web Interface
Chúng ta có thể kiểm tra giao diện web bằng cách mở nó trong trình duyệt của chúng ta và gửi một tệp âm thanh đến service.
Kết luận
Conclusion
Trong bài viết này, chúng ta đã khám phá cách thiết lập một Whisper service và tạo một giao diện web cho nó. Chúng ta cũng đã kiểm tra giao diện web bằng cách gửi một tệp âm thanh đến service. Các kho lưu trữ GitHub sẽ vẫn bị đóng băng để phù hợp với những gì được hiển thị trong video này. Nếu có bất kỳ thay đổi nào được thực hiện, một kho lưu trữ mới sẽ được tạo, kèm theo một video khác trên kênh này.
Một gamechanger nhẹ mà tôi đã chờ đợi.
GitHub dịch vụ Whisper: https://github.com/Ataraxxia/whisper-service
Frontend: https://github.com/Ataraxxia/whisper-service-frontend
Bài viết về dịch vụ Whisper: https://medium.com/@lbq999/self-hosting-openais-whisper-as-a-service-4b6191fb5cde
Mạng xã hội: https://discord.com/invite/ag8J3JftV5 https://www.twitch.tv/dctekkie https://www.instagram.com/dctekkie/ Hướng dẫn về Whisper AI Service
Phần 1: Giới thiệu (0s - 45s)
https://www.youtube.com/watch?v=xpLMTh8xoj8&t=0s
Trong phần này, người nói giới thiệu về Whisper AI service từ Open AI, có thể được sử dụng để xây dựng quy trình xử lý dựa trên nhận dạng giọng nói hoặc tạo một dịch vụ phiên âm.
Phần 2: Tổng Quan Hệ Thống (45s - 1m 20s)
https://www.youtube.com/watch?v=xpLMTh8xoj8&t=45s
Người nói giải thích rằng hệ thống sẽ được chia thành hai phần: AI service chính và frontend trang web. Hệ thống có thể tự lưu trữ trên máy Linux hoặc Windows có WSL.
Phần 3: dependencies và thiết lập (1m 20s - 2m 40s)
https://www.youtube.com/watch?v=xpLMTh8xoj8&t=80s
Người nói giải thích các dependencies cần thiết, bao gồm Linux, Python và FFmpeg, và cách thiết lập môi trường.
Phần 4: Tổng Quan Về Mã (2m 40s - 4m 20s)
https://www.youtube.com/watch?v=xpLMTh8xoj8&t=160s
Người nói đưa ra một cái nhìn tổng quan về mã, giải thích cách nó định nghĩa một lớp config, chọn một model và đặt các cài đặt cơ bản.
Phần 5: Chạy Service (4m 20s - 5m 30s)
https://www.youtube.com/watch?v=xpLMTh8xoj8&t=260s
Người nói trình bày cách chạy service, bao gồm kích hoạt môi trường ảo, khởi chạy script và gửi một tệp âm thanh đến service bằng lệnh curl.
Phần 6: Thêm Giao Diện Web (5m 30s - 7m 20s)
https://www.youtube.com/watch?v=xpLMTh8xoj8&t=330s
Người nói giải thích cách thêm một giao diện web vào service, bao gồm tạo một project riêng, cài đặt dependencies và thiết lập frontend.
Kết luận (7m 20s - 8m 30s)
https://www.youtube.com/watch?v=xpLMTh8xoj8&t=440s
Người nói kết luận bằng cách khuyến khích người xem dùng thử service và cung cấp các liên kết đến các kho lưu trữ GitHub.
Kết luận nhanh: Hướng dẫn này cung cấp một hướng dẫn từng bước về cách thiết lập và chạy Whisper AI service, một công cụ mạnh mẽ để xử lý và phiên âm các tệp âm thanh. Người nói giải thích các dependencies, tổng quan về mã và cách thêm một giao diện web vào service.