Deepgram (Chuyển giọng nói thành văn bản)
Deepgram là một API chuyển giọng nói thành văn bản. Trong OpenClaw, nó được sử dụng để chuyển đổi ghi chú thoại/âm thanh đến thông quatools.media.audio.
Khi được kích hoạt, OpenClaw tải tệp âm thanh lên Deepgram và chèn bản chuyển đổi vào quy trình phản hồi ({{Transcript}} + khối [Audio]). Đây không phải là streaming; nó sử dụng endpoint chuyển đổi đã ghi âm trước.
Website: https://deepgram.comTài liệu: https://developers.deepgram.com
Bắt đầu nhanh
- Thiết lập API key của bạn:
- Kích hoạt nhà cung cấp:
Tùy chọn
model: ID mô hình của Deepgram (mặc định:nova-3)language: gợi ý ngôn ngữ (tùy chọn)tools.media.audio.providerOptions.deepgram.detect_language: bật phát hiện ngôn ngữ (tùy chọn)tools.media.audio.providerOptions.deepgram.punctuate: bật dấu câu (tùy chọn)tools.media.audio.providerOptions.deepgram.smart_format: bật định dạng thông minh (tùy chọn)
Ghi chú
- Xác thực tuân theo thứ tự xác thực nhà cung cấp tiêu chuẩn;
DEEPGRAM_API_KEYlà cách đơn giản nhất. - Ghi đè endpoints hoặc headers với
tools.media.audio.baseUrlvàtools.media.audio.headerskhi sử dụng proxy. - Đầu ra tuân theo các quy tắc âm thanh giống như các nhà cung cấp khác (giới hạn kích thước, thời gian chờ, chèn bản chuyển đổi).