Chụp Ảnh và Video (agent)
OpenClaw hỗ trợ chụp ảnh và quay video cho quy trình làm việc của agent:- Node iOS (kết nối qua Gateway): chụp ảnh (
jpg) hoặc video ngắn (mp4, có thể kèm âm thanh) quanode.invoke. - Node Android (kết nối qua Gateway): chụp ảnh (
jpg) hoặc video ngắn (mp4, có thể kèm âm thanh) quanode.invoke. - Ứng dụng macOS (node qua Gateway): chụp ảnh (
jpg) hoặc video ngắn (mp4, có thể kèm âm thanh) quanode.invoke.
Node iOS
Cài đặt người dùng (mặc định bật)
- Tab Cài đặt iOS → Camera → Cho phép Camera (
camera.enabled)- Mặc định: bật (khóa bị thiếu được coi là đã bật).
- Khi tắt: các lệnh
camera.*trả vềCAMERA_DISABLED.
Lệnh (qua Gateway node.invoke)
-
camera.list- Phản hồi:
devices: mảng{ id, name, position, deviceType }
- Phản hồi:
-
camera.snap- Tham số:
facing:front|back(mặc định:front)maxWidth: số (tùy chọn; mặc định1600trên node iOS)quality:0..1(tùy chọn; mặc định0.9)format: hiện tại làjpgdelayMs: số (tùy chọn; mặc định0)deviceId: chuỗi (tùy chọn; từcamera.list)
- Phản hồi:
format: "jpg"base64: "<...>"width,height
- Giới hạn payload: ảnh được nén lại để giữ payload base64 dưới 5 MB.
- Tham số:
-
camera.clip- Tham số:
facing:front|back(mặc định:front)durationMs: số (mặc định3000, tối đa60000)includeAudio: boolean (mặc địnhtrue)format: hiện tại làmp4deviceId: chuỗi (tùy chọn; từcamera.list)
- Phản hồi:
format: "mp4"base64: "<...>"durationMshasAudio
- Tham số:
Yêu cầu chạy nền trước
Giống nhưcanvas.*, node iOS chỉ cho phép các lệnh camera.* trong nền trước. Các lệnh chạy nền sau trả về NODE_BACKGROUND_UNAVAILABLE.
Trợ giúp CLI (tệp tạm thời + MEDIA)
Cách dễ nhất để lấy tệp đính kèm là qua trợ giúp CLI, ghi phương tiện đã giải mã vào tệp tạm thời và inMEDIA:<path>.
Ví dụ:
nodes camera snapmặc định chụp cả hai hướng để cung cấp cho agent cả hai góc nhìn.- Các tệp đầu ra là tạm thời (trong thư mục tạm của hệ điều hành) trừ khi bạn tự xây dựng trình bao bọc.
Node Android
Cài đặt người dùng Android (mặc định bật)
- Bảng Cài đặt Android → Camera → Cho phép Camera (
camera.enabled)- Mặc định: bật (khóa bị thiếu được coi là đã bật).
- Khi tắt: các lệnh
camera.*trả vềCAMERA_DISABLED.
Quyền
- Android yêu cầu quyền chạy thời gian:
CAMERAcho cảcamera.snapvàcamera.clip.RECORD_AUDIOchocamera.clipkhiincludeAudio=true.
camera.* sẽ thất bại với lỗi *_PERMISSION_REQUIRED.
Yêu cầu chạy nền trước Android
Giống nhưcanvas.*, node Android chỉ cho phép các lệnh camera.* trong nền trước. Các lệnh chạy nền sau trả về NODE_BACKGROUND_UNAVAILABLE.
Lệnh Android (qua Gateway node.invoke)
camera.list- Phản hồi:
devices: mảng{ id, name, position, deviceType }
- Phản hồi:
Giới hạn payload
Ảnh được nén lại để giữ payload base64 dưới 5 MB.Ứng dụng macOS
Cài đặt người dùng (mặc định tắt)
Ứng dụng đồng hành macOS cung cấp một hộp kiểm:- Cài đặt → Chung → Cho phép Camera (
openclaw.cameraEnabled)- Mặc định: tắt
- Khi tắt: các yêu cầu camera trả về “Camera bị vô hiệu hóa bởi người dùng”.
Trợ giúp CLI (node invoke)
Sử dụng CLI chínhopenclaw để gọi các lệnh camera trên node macOS.
Ví dụ:
openclaw nodes camera snapmặc địnhmaxWidth=1600trừ khi được ghi đè.- Trên macOS,
camera.snapchờdelayMs(mặc định 2000ms) sau khi khởi động/ổn định phơi sáng trước khi chụp. - Payload ảnh được nén lại để giữ base64 dưới 5 MB.
An toàn + giới hạn thực tế
- Truy cập camera và micro kích hoạt các nhắc nhở quyền của hệ điều hành thông thường (và yêu cầu chuỗi sử dụng trong Info.plist).
- Video clip bị giới hạn (hiện tại
<= 60s) để tránh payload node quá lớn (overhead base64 + giới hạn tin nhắn).
Video màn hình macOS (cấp độ hệ điều hành)
Để quay video màn hình (không phải camera), sử dụng ứng dụng đồng hành macOS:- Yêu cầu quyền Ghi màn hình của macOS (TCC).