如果你最近正在規劃專業會議室或演講廳，你可能已經注意到目前的 AI 自動追蹤攝影機主要有兩種追蹤方式：

視覺追蹤（Visual Tracking）
聲音追蹤（Voice Tracking）

若希望 AI 自動追蹤攝影機能夠快速且準確地鎖定目標，關鍵就在於攝影機的「視覺」與音訊系統的「聽覺」之間的協同運作。

本文將介紹這套系統在實際應用中的運作方式，並分享幾個實用的設定技巧。

聲音定位與影像確認：一場接力賽

從概念上來說，攝影機尋找說話者的過程就像一場接力賽。

首先上場的是「耳朵」，也就是會議室中的 麥克風陣列（Microphone Array）。
這些麥克風可能安裝在天花板上，也可能整合在攝影機本體內。

當有人開始說話時，麥克風系統會利用聲波到達不同收音孔的微小時間差，快速計算出聲音來源的方向，例如：

前方左側
45 度方向

接著，音訊系統會立即將這些座標資訊傳送給 AI 自動追蹤攝影機，並指示鏡頭轉向該方向。

然而，僅僅轉向聲音來源還不夠。接下來由「眼睛」接手。

當鏡頭轉到大致方向後，攝影機內建的 AI 影像辨識 會快速掃描畫面，確認畫面中是否真的存在「人」。
一旦確認目標，AI 便會自動微調構圖，使說話者穩定地位於畫面中央。

換句話說：

音訊系統負責快速找到大致方向
AI 視覺系統負責精準鎖定與構圖

兩者缺一不可。

重要設定：理解 AFV 的真正含義

在設定 AI 自動追蹤系統時，你常常會看到一個名詞：

AFV（Audio Follow Video）

這裡需要特別注意，因為在傳統廣播領域與AI 會議系統中，AFV 的意思其實完全相反。

在傳統電視製作中：

AFV = Audio Follow Video

意思是：

當導播切換到某個畫面時，該畫面的麥克風才會被打開。

但在 AI 自動追蹤系統中，邏輯正好相反：Video Follow Audio

也就是：誰說話，鏡頭就切到誰。

例如：

Speaker A 說話 → 攝影機拍攝 A
Speaker B 回應 → 鏡頭轉向 B

因此，下次在設定介面看到 AFV 時，需要理解它的意思是：畫面會跟隨聲音來源切換。

為了避免混淆，現在有些系統會直接使用：

Voice Tracking
Audio Triggering

這些名稱通常更直觀。

AFV（聲音追蹤）的基本邏輯

在會議場景中，聲音觸發 AI 自動追蹤攝影機的流程通常如下：

聲音輸入（Sound Input）
有人開始說話。
聲音定位（Source Localization / DSP 處理）
麥克風陣列接收聲音並計算來源座標，例如水平角度與高度。
條件過濾（Filter Check）
系統會判斷：
- 聲音是否足夠大（Noise Gate）
- 聲音是否持續足夠時間（避免短暫雜音）
- 聲音來源是否位於黑名單區域
發送控制指令（Send Command）
若聲音有效，系統會向攝影機發送 PTZ 控制指令（Pan / Tilt / Zoom）。
AI 視覺確認（Visual Refinement）
攝影機轉向該位置，AI 進行人臉識別並完成最終構圖微調。

為什麼攝影機一直拍電視？你需要設定「黑名單」

在實際應用中，最常見的問題之一是：誤觸發（False Trigger）

想像以下情境：

在遠端視訊會議中，對方的聲音從會議室的喇叭播放出來。
AI 系統誤以為「喇叭正在說話」，於是攝影機轉向拍攝電視或音響設備。

除了喇叭之外，以下聲音也可能造成誤判：

重重關門的聲音
走廊的噪音
空調風口的持續聲音
麥克風附近的鍵盤敲擊聲

為了避免這些問題，可以在系統中設定 Exclusion Zones（排除區域），也就是常說的「黑名單」。

設定方式通常非常直觀：

在軟體介面中通常會有一個虛擬平面圖，
只需要用滑鼠在以下區域畫出框線：

喇叭位置
門口
其他干擾聲來源

這樣系統就會知道：即使這些區域出現很大的聲音，也不需要觸發追蹤。

只要正確設定這些排除區域，整個 AI 聲音追蹤系統的穩定度就能大幅提升。

總結

AI 自動追蹤攝影機與聲音系統的整合，關鍵在於 麥克風陣列與 AI 演算法之間的協同運作。

AFV 在傳統導播系統中代表 Audio Follow Video，
但在 AI 追蹤應用中，實際上變成 Video Follow Audio。

理解這個原理並正確設定系統，可以幫助你在部署 AI 自動追蹤攝影機時避免常見錯誤，並讓整個系統運作得更加穩定與高效。

AI 自動追蹤攝影機如何與聲音系統協作：聲音追蹤的運作方式

AI 自動追蹤攝影機如何與聲音系統協作：聲音追蹤的運作方式

聲音定位與影像確認：一場接力賽

重要設定：理解 AFV 的真正含義

AFV（聲音追蹤）的基本邏輯

為什麼攝影機一直拍電視？你需要設定「黑名單」

總結

熱門新聞

Datavideo 系統控制整合中心正式登場 – 您的一站式產品協議與相容性查詢平台

SDI vs. HDMI | 有什麼不同？

Datavideo全新「智能解決方案創建工具」上線：輕鬆訂製您的影片製作系統！

Datavideo SHOWCAST 100 與 HS-4000 雙雙榮獲第33屆台灣精品獎

Datavideo 四十週年感謝品牌之路上的每一位夥伴

AI 自動追蹤攝影機如何與聲音系統協作：聲音追蹤的運作方式

AI 自動追蹤攝影機如何與聲音系統協作：聲音追蹤的運作方式

聲音定位與影像確認：一場接力賽

重要設定：理解 AFV 的真正含義

AFV（聲音追蹤）的基本邏輯

為什麼攝影機一直拍電視？你需要設定「黑名單」

總結

熱門新聞

Datavideo 系統控制整合中心正式登場 – 您的一站式產品協議與相容性查詢平台

SDI vs. HDMI | 有什麼不同？

Datavideo全新「智能解決方案創建工具」上線：輕鬆訂製您的影片製作系統！

Datavideo SHOWCAST 100 與 HS-4000 雙雙榮獲第33屆台灣精品獎 ​

Datavideo 四十週年 感謝品牌之路上的每一位夥伴

Datavideo SHOWCAST 100 與 HS-4000 雙雙榮獲第33屆台灣精品獎

Datavideo 四十週年感謝品牌之路上的每一位夥伴