導讀:AI在軍隊中的另一項重要作用在于,實現(xiàn)更好的人才管理。
每每說起AI與機器人,很多人腦海中首先浮現(xiàn)的往往是那些“后啟示錄時代”下恐怖、且具有強大超智能的機器,它們橫行無忌、甚至占領了整個世界乃至宇宙。電影《終結者》可以說是人們對于AI恐懼之情的典型具象體現(xiàn),其中的天網(Skynet)——以計算機為基礎的人工智能防御系統(tǒng),被影片稱為“基于人工神經網絡的集體意識與人工通用型超智能系統(tǒng)”。但目前看來,AI似乎并不像科幻小說中所描述的那樣充滿戾氣。相反,AI正在執(zhí)行諸多繁瑣且傳統(tǒng)上只能以手動方式完成的任務,同時為我們帶來從識別到對話、再到預測分析模式匹配的各類自主系統(tǒng)。
相較于科幻片里夸張的想象力與創(chuàng)造力,現(xiàn)實中的軍事組織在AI領域的投資卻尤為真實。以幫助人類更好地完成現(xiàn)有任務的角度,機器學習與AI的實現(xiàn)方式真沒那么戲劇性。有趣的是,提升機器智能的過程,反而令人類得以更好地理解并控制周邊的環(huán)境。
美國陸軍研究實驗室機動與機動性事務AI與機器學習應用性能管理負責人John Fossaceca最近在一場AI大會上(AI in Government)發(fā)表演講,分享了“AI如何應對各類日常場景?”,同時也介紹了“美國陸軍的自主機器人乃至其他機器的未來發(fā)展方向”。
問:美國陸軍目前如何運用AI技術?
John Fossaceca:陸軍正在以多種方式使用AI技術,例如將其引入預測性維護當中。AI技術能夠幫助我們預測,如何搶在汽車發(fā)生故障之前,替換或維修相關的零配件。做到了這一點,我們將節(jié)約下大量金錢并提高操作安全性。目前布拉德利戰(zhàn)車等多種軍用載具都在嘗試這項功能。
陸軍方面掌握著大量數(shù)據,而AI與機器學習技術普遍需要大規(guī)模數(shù)據支持。以Maven項目為例,此計劃使用無人機發(fā)回的數(shù)據幫助分析人員自動完成某些軍事工作。Maven項目中就使用到一系列標準化AI工具,例如谷歌的TensorFlow,當然也配合陸軍內部構建的自定義工具。
陸軍還在積極研究,使用AI技術增強自動駕駛汽車、電子戰(zhàn)與信號情報、傳感器融合以及增強現(xiàn)實等等。AI將通過聯(lián)合全域指揮與控制(JAD-C2)等計劃,提高戰(zhàn)場上的態(tài)勢感知能力,最終改善軍方的決策制定水平。
AI在軍隊中的另一項重要作用在于,實現(xiàn)更好的人才管理。目前,陸軍AI特遣隊(AITF)就在主動使用AI技術,尋求成功作戰(zhàn)所必需的能力與屬性,并結合這些需求物色潛在的軍事人才。
在作戰(zhàn)能力發(fā)展司令部下轄的陸軍研究實驗室(ARL)中,AI已經成為一大主要研究領域。ARL可以算是陸軍內部的研發(fā)中心,管理著多項AI相關計劃。以名為“機動與機動性人工智能(AIMM)”的基本研究計劃為例,其目標在于引導陸軍思考如何為下一代戰(zhàn)斗車輛(NGCV)在無需人為介入的前提下獲得良好的越野能力。這些下一代智能車輛,能夠根據特殊情況、環(huán)境條件做出推理,進而做出最佳行動決策,同時向士兵發(fā)出情況通報,以提高對戰(zhàn)場的態(tài)勢感知水平。ARL還擁有其他多項重要研究計劃,并著力運用AI方法在其中推動創(chuàng)新,相信這一切都將給未來的陸軍帶來更強的作戰(zhàn)能力。
將來,美國陸軍將使用AI技術處理來自多個傳感器的輸入數(shù)據,借此準確描繪戰(zhàn)場威脅,同時加快由陸軍未來司令部領導的Convergence(融合)項目中的目標制定與目標決策過程。
問:采用人工智能/機器學習技術,陸軍面臨哪些挑戰(zhàn)?
John Fossaceca:「商業(yè)AI」依賴于龐大的計算資源與海量數(shù)據,其中云計算資源能夠及時向終端返回處理結果。但另一方面,「戰(zhàn)地AI」則受限于邊緣設備——計算機處理器相對輕量化,且在戰(zhàn)場對抗環(huán)境下通信帶寬可能較有限。
在陸軍的實際應用中,我們通常得不到充足的訓練數(shù)據,現(xiàn)有的數(shù)據往往已經損壞或者噪聲過多。運營環(huán)境也趨于動態(tài)變化,有時會因道路、建筑物以及基礎設施受損而變得混亂不堪。另外,我們需要面對來自多個來源的異類數(shù)據,某些數(shù)據甚至具有欺騙性或者已經受到對手的操縱。
目前的AI技術往往非常脆弱,甚至在理想的運營條件下也有可能發(fā)生崩潰。其推理能力也非常有限,特別是在實時推理方面表現(xiàn)不佳。部分已經部署的系統(tǒng)雖然不斷強調其AI能力,但實際功能往往受限于硬編碼規(guī)則,而缺乏從傳感器及其他系統(tǒng)收集輸入內容,并做出推斷與推理的能力——更遑論提供增強型態(tài)勢評估了。
相當一部分AI方法都依賴于“監(jiān)督學習”(例如深度學習),這類技術會構建起龐大的模型,通常需要在超大規(guī)模計算基礎設施之上,以“批處理”形式學習成上千萬甚至上億個參數(shù)。很明顯,陸軍需要的是能夠擺脫這類束縛、真正擁有在線實時推理能力的解決方案。
最終我們發(fā)現(xiàn),現(xiàn)有系統(tǒng)并不能真正自動運行,其仍需要人為介入、干預乃至手動控制。早在2018年,我們就開始嘗試通過反饋進行學習,由人類觀察者向智能代理提供正面或負面信號。通過這種方式,我們證明可以大幅縮短學習時間。我們將這項研究擴展并總結為“示范學習”,稍后我們會進一步討論這個議題。
隨著研究的深入,我們意識到需要一種與「智能代理」的自然交互方式。除了自然的對話與接觸之外,由于AI缺少對世界的認知常識與“樸素推理”能力,很多問題隨之浮出水面。我們則通過AIMM中的第二項工作——上下文感知決策制定——努力攻克這些挑戰(zhàn)。
問:陸軍如何為人工智能/機器學習項目提供數(shù)據支持?
John Fossaceca:陸軍乃至整個國防部,都在開展大規(guī)模數(shù)據收集與標記工作,借此為AI算法準備可用的數(shù)據資源。例如,Maven項目中就使用到大量來自無人機的視頻素材。有時候,我們也會根據保密級別,通過眾包技術進行數(shù)據標記。其他舉措還包括ARL的內部工作,例如從各個位置收集內部數(shù)據,并與研究合作伙伴一道整理并標記各類地形數(shù)據。ARL在馬里蘭州設有機器人研究合作園區(qū)(R2C2),在園區(qū)內收集數(shù)據并進行各類自主實驗。
除了Maven項目之外,國防部還在運用先進工具進行情報分析。其中大部分項目致力于使用深度學習方法檢測圖像中的特定對象,而實現(xiàn)的前提,自然是對大量數(shù)據進行清洗、整理與標記。此外,項目還要求研究人員使用存儲、算法工具包、計算資源、測試以及部署工具共同構建起AI管道。為此,項目團隊往往需要開發(fā)出數(shù)據格式標準,以保證實驗與測試場景之間保持一致,并為用戶提供熟悉的環(huán)境。數(shù)據存儲庫本身也需要進行分類以供用戶訪問,同時保證其中的數(shù)據隨附可用描述。為了在多個數(shù)據庫之間實現(xiàn)信息訪問標準化,軍方做出一系列努力,旨在降低情報界使用AI成果的門檻。
問:陸軍如何利用自動駕駛汽車實現(xiàn)機動性目標?
John Fossaceca:在陸軍的機器人與自主系統(tǒng)(RAS)戰(zhàn)略中,副總參謀長Daniel B. Allyn將軍明確提到,“RAS的整合,將幫助未來作為聯(lián)合部隊重要組成部分的美國陸軍,獲得克敵制勝、控制地形、保護民眾以及鞏固利益的能力。RAS還將幫助未來的陸軍部隊得以與其他多個領域的戰(zhàn)斗行動保持統(tǒng)一,將力量從陸地投射至海洋、太空以及網絡等多個空間,共同維護聯(lián)合部隊的行動與作戰(zhàn)靈活性。”
根據RAS戰(zhàn)略的描述,“有效整合RAS,將提高美軍維持高強度作戰(zhàn)的能力,并使敵方無法做出有效反應。陸軍必須加緊建立自己的RAS能力,這是一場與敵方比拼速度的RAS軍備競賽。一旦落后,敵方將采用一系列新策略破壞美國的軍事優(yōu)勢,并借此獲悉的美國軍事體系劣勢?!?/p>
為了實現(xiàn)RAS戰(zhàn)略的愿景,自動駕駛車輛必須能夠保障“機動自由”,同時降低士兵的傷亡風險。這就要求人類與機器之間實現(xiàn)自主協(xié)作。車輛將成為戰(zhàn)場上的隊友,而不再只是一種武器裝備。這些“人機集成小隊將幫助軍方在情況不明的條件下探尋、適應、戰(zhàn)斗并最終取勝?!?/p>
AI技術無疑是這些智能自主系統(tǒng)的關鍵驅動力之一。美國陸軍還必須直面客觀事實,即其對手也將使用自主系統(tǒng)。在自主水平不斷升級的背景下,機器人自主系統(tǒng)將不再依賴于通信鏈路——因為干擾及傳輸容量的限制,通信鏈路在戰(zhàn)場條件下幾乎得不到任何保障。
從優(yōu)先級角度出發(fā),RAS戰(zhàn)略要求在短期內改善態(tài)勢感知水平,并幫助減輕士兵的體力負擔。著眼于中期,“自主車輛行動”不僅有助于維持戰(zhàn)場形勢,同時也將為士兵提供掩護。最終從長遠來看,自動駕駛汽車將獲得執(zhí)行先進戰(zhàn)術的能力,進而“提高旅級戰(zhàn)斗團隊的能力”。
問:哪些獨特的環(huán)境挑戰(zhàn),會影響到自動駕駛汽車與設備的研究工作?
John Fossaceca: 除了復雜的地形與非結構化環(huán)境之外,敵對方也有可能對陸軍的作戰(zhàn)環(huán)境帶來不可預測的影響。陸軍的研究,專門針對所謂“戰(zhàn)術行為”,即自動駕駛汽車應該采用怎樣的特定形式?自動駕駛汽車如何在兩軍對抗中奪取優(yōu)勢地位?自動駕駛汽車如何在不被敵軍發(fā)現(xiàn)的情況下運行?陸軍已經就此做出深入研究,并著力保證下一代作戰(zhàn)車輛能夠推理出所有潛在路線——甚至包括涉水路線。
問:ARL在無人駕駛汽車方面的研究,與民用行業(yè)的研究有何不同?
John Fossaceca:在陸軍作戰(zhàn)環(huán)境中,通常很難收到規(guī)模化、與軍事相關且具有明確標記的數(shù)據,因此ARL一直高度關注AI算法,希望探索出一條對數(shù)據依賴性遠低于傳統(tǒng)監(jiān)督方法的新道路。與此相匹配,陸軍將針對場景分割等用例,開發(fā)「無監(jiān)督方法」,希望實現(xiàn)對數(shù)據的自動標記。
然而,這樣的方法目前仍然需要大量算力,因此很難在自動駕駛車輛上實時完成處理。為了解決這個問題,陸軍邀請多位計算機科學家,由他們專職研究計算機架構與算法,旨在通過先進方法幫助陸軍在自動駕駛車輛能夠支持的處理器尺寸與功率限制內,達成預期效果。
陸軍顯然面臨著商業(yè)部門難以想象、也完全無法解決的獨特技術挑戰(zhàn)。商用自主車輛不需要過多考慮運行環(huán)境中的破壞性因素——除了人員、障礙物甚至是意外事件,軍事行動往往發(fā)生在極不確定的環(huán)境當中,地形危險而復雜、敵對方也可能設下種種威脅陷阱。
首批實例將采用遠程操作形式,陸軍也將在遙控過程中逐步摸索出此類車輛的操作方式,學習如何在戰(zhàn)場上使用機器人。以此為依據,我們將了解應該開發(fā)出怎樣的自主行為。最終,下一代戰(zhàn)斗車輛將擁有現(xiàn)場學習、形勢適應、推理以及有效采取行動,以支持多領域作戰(zhàn)任務的能力。
問:面對AI挑戰(zhàn),您有哪些經驗之談?
John Fossaceca:近期的陸軍研究發(fā)現(xiàn),利用人類示范與反饋的深度強化學習技術已經取得了成功。這些新型方法的成功,大大減少了在新任務中訓練系統(tǒng)的時間周期。
而通過人類演示的其他研究表明,即使只使用有限的示例,同樣可以在戰(zhàn)場上通過再訓練獲得一定程度的實用性、甚至是實時學習的潛力。這些技術似乎還能夠與遷移學習相融合,即在一組條件下學習,并將模型成果引入至另一組全新條件,且無需從零開始重新訓練。
問:在美國陸軍看來,未來的戰(zhàn)場與士兵將呈現(xiàn)出怎樣的面貌?
John Fossaceca:在美國陸軍看來,未來的戰(zhàn)場上將出現(xiàn)無人編隊,其速度遠超當前人員編隊。其中一項目標,是讓自主系統(tǒng)對區(qū)域及路線進行偵察,發(fā)現(xiàn)或與敵方接火,同時為士兵提供防御支援。
問:AI技術對于陸軍的未來發(fā)展愿景有何重要意義?
John Fossaceca:AI技術將成為未來多域作戰(zhàn)中取得成功的關鍵驅動力。根據前陸軍部長兼現(xiàn)任國防部長Mark Esper的說法,“如果我們能夠掌控AI,那么它一定能夠更好地保護美國人民。要在未來的戰(zhàn)場上取勝,我們就需要比敵人更快行動,同時盡可能降低部隊與資源的風險等級。誰能先實現(xiàn)這個目標,誰就將在未來幾年的戰(zhàn)場上保持決定性的優(yōu)勢?!?/p>
現(xiàn)任陸軍部長Ryan McCarthy則表示,基于云的技術與功能將成為“AI最大化”道路上的核心因素。McCarthy希望全面推廣云基礎設施部署,借此推動AI技術發(fā)展。
問:陸軍對于“以符合道德及負責任的方式使用AI技術”有何看法?
John Fossaceca:美國陸軍及國防部都在高度關注AI倫理問題,并于去年10月提出了《關于以符合倫理道德的方式使用人工智能的建議》草案。這些規(guī)則也將適用于美國軍隊。美國軍方將招納人才,保證所有AI系統(tǒng)都有對應人員負責管理。
陸軍的AI特遣隊也設有一位道德官員,可協(xié)助通報AI道德政策。陸軍部長Ryan McCarthy表示,“系統(tǒng)可以快速處理數(shù)據并提供答案,但卻無法提供上下文信息。只有人類才能根據實際環(huán)境做出決策?!?/p>
問:目前,您采取哪些措施保證軍方能夠擁有充足的AI相關人力與作戰(zhàn)人員儲備?軍方內部是否正在開展AI相關培訓與教育計劃?
John Fossaceca:ARL與陸軍為學生提供大量實習機會與SMART獎學金,這些獎學金可以幫助學生支付教育費用。而作為交換,學生將為陸軍工作一段時間。ARL還聘用了新的博士畢業(yè)生進行博后研究,借此將他們帶入前沿研究領域。最終,部分博士后將成為內部員工。人工智能已經成為當前的核心研發(fā)方向,因此陸軍也將逐步雇用更多具備這方面專業(yè)知識的科學家與工程師。
問:在幫助士兵適應與自主系統(tǒng)及機器人協(xié)同方面,您做了哪些嘗試與努力?
John Fossaceca:我們之前討論的各類自主系統(tǒng)仍在開發(fā)當中,因此目前我們只能在訓練環(huán)境內使用仿真技術幫助士兵適應這些自主系統(tǒng)。陸軍在這方面尚處于起步階段,但確實正在推進部分計劃,例如可重構虛擬集體教練機(RVCT)及其包含的地面與空中平臺,這些平臺能夠使用模擬數(shù)據實現(xiàn)多種演練任務。
目前的大部分訓練工作都集中在對“智能半自主系統(tǒng)”與“自主系統(tǒng)”的仿真模擬方面,這是為了給士兵提供身臨其境的訓練體驗。士兵們在這類綜合訓練環(huán)境(STE)中與虛擬對手對抗。這些虛擬對手能夠實施各類智能行為,其中甚至包含一定的不可預測性,用以模擬敵對方可能做出的選擇以及合理的認知水平。這必然需要將最先進的人工智能與現(xiàn)實環(huán)境結合起來。
在基礎研究層面,ARL則引導士兵與自主原型方案進行交互,幫助AI系統(tǒng)熟悉士兵的說話方式,以及他們傾向于使用哪些命令。反過來,士兵也將逐漸摸清AI系統(tǒng)的“脾氣”。實際上,在引導士兵與自主系統(tǒng)協(xié)同訓練之后,士兵們很快就開始嘗試以更適合對方的語言進行表達,從而高效完成溝通與系統(tǒng)控制。
問:未來幾年,您最期待哪些AI技術?
John Fossaceca:我們在使用人工智能進行環(huán)境推理方面取得了長足的進步,也能夠向士兵隊友們推薦具體的行動方案。這代表著我們的人工智能正從“窄AI范疇(即只能完成某些高度具體任務的自主代理)”向真正具備新情況適應能力的方向升級。
未來,這些AI代理將能夠確定哪些行動具有可行性,以及每種選擇所對應的成功概率。這雖然還不能算是“人工通用智能”,但已經能夠以接近人類的水平執(zhí)行推理。未來,我們希望讓自主系統(tǒng)能夠根據特定情況做出復雜推理、執(zhí)行復雜決策,并預測各類可能的結果,以最大程度提升任務的成功幾率。