發布時間:2024-01-24閱讀(14)
新京報貝殼財經訊(記者羅亦丹)能夠擊敗《星際爭霸2》職業選手的AI將不再是谷歌的“專利”。
繼谷歌旗下DeepMind公司開發的人工智能模型“阿爾法星際”在《星際爭霸2》游戲中擊敗人類職業選手后,6月12日,國內人工智能軟件公司商湯科技宣布其研發出了可媲美職業玩家競技水平的《星際爭霸2》人工智能模型“DI-star”,并展示了該人工智能模型擊敗人類頂尖職業玩家的對決視頻。
人機對戰的歷史由來已久,從“深藍”擊敗人類國際象棋選手到“阿爾法狗”擊敗人類圍棋選手,人工智能已逐漸具備了超越人類頂尖選手的決策能力。而《星際爭霸2》這款業界公認的具有超高游戲難度和公平競技性的即時戰略游戲也成為諸多AI爭相挑戰的新“珠峰”。
具體來看,《星際爭霸2》的空間復雜度高達10的1685次方,遠遠超出圍棋10的170次方的復雜度,在近乎天文數字一般的龐大狀態空間中進行復雜的策略博弈,這使得《星際爭霸2》成為了檢驗AI決策能力的絕佳舞臺。
在商湯科技智慧決策與游戲事業部技術研發負責人周航展示的兩場比賽中,DI-star在與中國臺灣選手Rex的對戰過程中依靠精細的微操建立了前期優勢,而在與前世界冠軍Scarlett的對戰中,DI-star使用出了女王前壓這樣的人類選手不常見的戰術,最終出奇制勝。值得一提的是,周航此前曾是中國頂尖的《星際爭霸2》選手,曾獲得8次全國星際爭霸2比賽冠軍。
在展示中,周航通過多個對戰演示片段,展現了DI-star能夠在復雜對局中快速找到最優策略的能力。據了解,DI-star融合了監督學習和強化學習等商湯多項前沿技術,為AI智能體賦予人類宗師分段水平的決策能力。通過監督學習,DI-star讓AI反復觀摩人類職業玩家對戰的高質量錄像學習人類的打法,快速掌握資源采集、單位生產,以及戰斗過程中成百上千步的決策行為。在監督學習的基礎上,DI-star通過強化學習讓AI通過自我博弈的方式進行大量對局,持續提升全局的決策能力和整體的競技水平。
商湯方面表示,商湯AI大裝置為DI-star的模型建立、訓練和驗證提供了強大的算法和算力基礎,幫助DI-star用更短的時間達成媲美甚至戰勝人類專業高手的對戰水平。依托商湯AI大裝置,DI-star通過5周的時間完成了大約一億局對戰,最終達到了人類最高段位宗師分段競技水平。目前,DI-star及其背后的決策智能平臺已經在GitHub開源。

在商湯展示的視頻中,DI-star使用出女王前壓這樣的人類選手不常見戰術出奇制勝
編輯 宋鈺婷
校對 柳寶慶
Copyright ? 2024 有趣生活 All Rights Reserve吉ICP備19000289號-5 TXT地圖HTML地圖XML地圖