機器視覺

 

1983 年的早期Automatix(現為Omron的一部分)機器視覺系統 Autovision II 在一次貿易展上進行了展示。三腳架上的相機向下指向光台,以產生螢幕上顯示的背光影像,然後對該影像進行斑點提取

機器視覺是用於為自動檢測、製程控制和機器人引導等應用 (通常在工業中)提供基於成像的自動檢測和分析的技術和方法。機器視覺是指多種技術、軟硬體產品、整合系統、動作、方法和專業知識。機器視覺作為一門系統工程學科可以被認為與電腦視覺(電腦科學的一種形式)不同。它試圖以新的方式整合現有技術並將其應用於解決現實世界的問題。該術語是工業自動化環境中這些功能的常用術語,但也用於其他環境車輛引導中的這些功能。

整個機器視覺流程包括規劃需求和專案的細節,然後創建解決方案。在運行時,該過程從成像開始,然後自動分析影像並提取所需資訊。

定義

「機器視覺」一詞的定義各不相同,但都包括用於自動從圖像中提取資訊的技術和方法,這與輸出是另一幅圖像的圖像處理相反。提取的資訊可以是簡單的好部分/壞部分訊號,或更複雜的資料集,例如影像中每個物件的身份、位置和方向。這些資訊可用於工業中的自動偵測、機器人和流程引導、安全監控和車輛引導等應用。[ 1 [ 2 [ 3 ]此領域包含大量技術、軟硬體產品、整合系統、行動、方法和專業知識。[ 3 [ 4 ] 機器視覺其實是工業自動化應用中用於這些功能的唯一術語;對於其他環境(例如安全和車輛引導)中的這些功能,該術語不太通用。機器視覺作為一門系統工程學科,可以被認為與電腦視覺不同,電腦視覺是基礎電腦科學的一種形式。機器視覺試圖以新的方式整合現有技術,並以滿足工業自動化和類似應用領域要求的方式應用它們來解決現實世界的問題。[ 3 ] : 5  [ 5 ] 這個術語也被貿易展覽和貿易團體(例如自動成像協會和歐洲機器視覺協會)以更廣泛的含義使用。這個更廣泛的定義還包括最常與影像處理相關的產品和應用。[ 4 ] 機器視覺的主要用途是自動檢查和工業機器人/製程引導。[ 6 [ 7 ] : 6–10  [ 8 ]最近,電腦視覺和機器視覺這兩個術語已經在更大程度上趨同。[ 9 ] : 13 請參閱機器視覺術語表

基於成像的自動檢測和分類

機器視覺的主要用途是基於成像的自動檢查和分類以及機器人引導。[ 6 [ 7 ]: 本節的6-10前者縮寫為「自動檢查」。整個過程包括規劃需求和專案的細節,然後創建解決方案。[ 10 [ 11 ]本節描述解決方案運作期間發生的技術流程。

操作方法和順序

自動偵測操作序列的第一步是擷取影像,通常使用相機、鏡頭和照明,這些設備旨在提供後續處理所需的差異化。[ 12 [ 13 ] MV軟體包和其中開發的程序然後採用各種數位影像處理技術來提取所需的信息,並且通常根據提取的信息做出決策(例如通過/失敗)。[ 14 ]

裝置

自動偵測系統的組件通常包括照明、相機或其他成像器、處理器、軟體和輸出設備。[ 7 ]:11-13 

影像學

成像設備(例如相機)可以與主影像處理單元分離,也可以與其組合,在這種情況下,該組合通常稱為智慧型相機或智慧型感測器。[ 15 [ 16 ] 將完整的處理功能包含在與相機相同的外殼中通常稱為嵌入式處理。[ 17 ]分離後,可以使用類比或標準化數位介面(Camera LinkCoaXPress ) 連接到專用中間硬體、客製化處理設備或電腦內的影像擷取卡[ 18 [ 19 [ 20 [ 21 ] MV 實作也使用能夠透過FireWireUSB千兆位元乙太網路介面直接連接(無需影像擷取卡)到電腦的數位相機。[ 21 [ 22 ]

雖然傳統(2D 可見光)成像最常用於 MV,但替代方案包括多光譜成像高光譜成像、各種紅外線波段成像、[ 23 ] 線掃描成像、表面3D 成像和 X 射線成像。 [ 6 ] MV 2D 可見光成像的主要區別在於單色與彩色、幀速率、分辨率,以及成像過程是否在整個影像上同步,使其適合移動過程。[ 24 ]

儘管絕大多數機器視覺應用都是使用二維成像來解決的,但利用 3D 成像的機器視覺應用在業界正在不斷發展。[ 25 [ 26 ]最常用的 3D 成像方法是基於掃描的三角測量,它在成像過程中利用產品或影像的運動。雷射投射到物體的表面。在機器視覺中,這是透過掃描運動來完成的,或者透過移動工件,或透過移動相機和雷射成像系統。攝影機從不同角度觀察這條線;線的偏差代表形狀變化。來自多次掃描的線被組合成深度圖或點雲。[ 27 ] 立體視覺用於涉及一對相機的兩個視圖中存在的獨特特徵的特殊情況。[ 27 ]用於機器視覺的其他 3D 方法是飛行時間方法和基於網格的方法。[ 27 [ 25 ]一種方法是基於網格陣列的系統,使用偽隨機結構光系統,大約2012Microsoft Kinect 系統所採用的。

影像處理

獲取影像後,對其進行處理。[ 20 ]中央處理功能通常由CPUGPUFPGA或它們的組合來完成。 [ 17 ] 深度學習訓練和推理對處理表現提出了更高的要求。[ 30 ] 通常依序使用多個處理階段,最終得到所需的結果。典型的序列可能從修改圖像的過濾器等工具開始,然後提取對象,然後從這些對像中提取(例如測量、讀取代碼)數據,然後傳遞該數據,或將其與目標值進行比較,以獲得出結果。機器視覺影像處理方法包括;

  • 拼接/配準:合併相鄰的 2D 或 3D 影像。[需要引用]
  • 濾波(例如形態濾波[ 31 ]
  • 閾值處理:閾值處理從設定或確定對以下步驟有用的灰階值開始。然後,該值用於分離影像的各個部分,有時根據影像的每個部分是低於還是高於該灰階值,將其轉換為簡單的黑白。[ 32 ]
  • 像素計數:計算亮像素或暗像素的數量[需要引用]
  • 分割:將數位影像劃分為多個片段,以簡化和/或將影像的表示更改為更有意義且更易於分析的內容。[ 33 [ 34 ]
  • 邊緣偵測:尋找物體邊緣[ 35 ]
  • 顏色分析:使用顏色識別零件、產品和物品,根據顏色評估質量,並使用顏色隔離特徵[ 6 ]
  • 斑點偵測與擷取:檢查影像中連接像素的離散斑點(例如灰色物體中的黑洞)作為影像地標。[ 36 ]
  • 神經網路/深度學習/機器學習處理:加權和自訓練多變量決策[ 37 ] 大約2019年對此有一個大的擴展,利用深度學習和機器學習來顯著擴展機器視覺能力。這種處理最常見的結果就是分類。分類的範例是物件識別、所識別物件的「通過、失敗」分類和OCR。[ 37 ]
  • 模式識別包括模板匹配。尋找、匹配和/或計算特定模式。這可能包括可能旋轉、被另一個物件部分隱藏或大小變化的物件的位置。[ 38 ]
  • 條碼資料矩陣與「二維條碼」讀取  [ 39 ]
  • 光學字元辨識:自動讀取序號等文字  [ 40 ]
  • 測量/計量:物體尺寸的測量(例如以像素、  英吋毫米為單位)  [ 41 ]
  • 與目標值進行比較以確定“通過或失敗”或“通過/不通過”結果。例如,透過程式碼或條碼驗證,將讀取的值與儲存的目標值進行比較。對於測量,將測量值與正確的值和公差進行比較。為了驗證字母數字代碼,將 OCR 值與正確值或目標值進行比較。為了檢查瑕疵,可以將測量的瑕疵尺寸與品質標準允許的最大值進行比較。[ 39 ]

輸出

自動檢測系統的常見輸出是通過/失敗決策。[ 14 ]這些決定可能會觸發拒絕失敗項目或發出警報的機制。其他常見輸出包括機器人引導系統的物體位置和方向資訊。[ 6 ]此外,輸出類型包括數值測量資料、從程式碼和字元讀取的資料、物件的計數和分類、流程或結果的顯示、儲存的影像、自動空間監控MV系統的警報以及製程控制訊號。[ 10 [ 13 ]這也包括使用者介面、用於整合多組件系統的介面和自動資料交換。[ 42 ]

深度學習

深度學習一詞具有多種含義,其中大部分含義可以應用於機器視覺領域超過 20 年的技術。然而,隨著將此類技術成功應用於工業機器視覺領域的整個圖像的能力的出現,「機器視覺」一詞的使用開始於 2010 年代後期。[ 43 ]傳統的機器視覺通常需要機器視覺自動偵測解決方案的「物理」階段來創建可靠的簡單的缺陷區分。 「簡單」區分的一個例子是,產品的缺陷是深色的,好的部分是淺色的。某些應用程式不可行的一個常見原因是無法實現「簡單」;深度學習消除了這一要求,本質上更像人類「看到」物體,使得現在可以完成這些自動應用程式。[ 43 ]系統在訓練階段從大量影像中學習,然後在運行時使用期間執行檢查,稱為「推理」。[ 43 ]

基於成像的機器人引導

機器視覺通常向機器人提供位置和方向訊息,以允許機器人正確抓取產品。此功能也用於引導比機器人更簡單的運動,例如 1 軸或 2 軸運動控制器。[ 6 ] 整個過程包括規劃需求和專案的細節,然後創建解決方案。本節描述解決方案運作期間發生的技術流程。許多流程步驟與自動檢測相同,只是重點是提供位置和方向資訊作為結果。[ 6 ]

市場

就在 2006 年,一位產業顧問報告 MV 在北美代表 15 億美元的市場。[ 44 ]然而,MV 貿易雜誌的主編聲稱,“機器視覺本身並不是一個行業”,而是“技術和產品的集成,這些技術和產品提供的服務或應用程序有利於汽車或汽車等真正的行業」。消費品製造、農業和國防。” [ 4 ]

參見

沒有留言:

張貼留言

Love the Lord your God with all your heart and with all your soul and with all your mind.

耶 穌 對 他 說 : 你 要 盡 心 、 盡 性 、 盡 意 愛 主 ─ 你 的 神 。

—— Matthew 22:37 —— 馬 太 福 音 22:37