盤算機仿真機器人世界杯足球錦標賽攻防戰(zhàn)術(shù)的鉆研

時間：2023-03-23 07:54:11 計算機畢業(yè)論文我要投稿

相關(guān)推薦

【摘要】隨著盤算機技巧的發(fā)展，散播式人工智能中多智能體系統(tǒng) (MAS Multi-agent System)的理論及利用鉆研已經(jīng)成為人工智能鉆研的熱門，RoboCup（Robot World Cup），即機器人世界杯足球錦標賽，是一個在異步，有噪聲的對抗環(huán)境下，鉆研多智能體的決策和合作的問題。本文詳細介紹了盤算機仿真足球機器人比賽中進攻和防守的設計與實現(xiàn)。

盤算機仿真機器人世界杯足球錦標賽攻防戰(zhàn)術(shù)的鉆研

【要害詞】進攻;組織性;正確 ;快速;防守;機動性

RoboCup（Robot World Cup），即機器人世界杯足球錦標賽。它是國際上一項為進步相干領(lǐng)域的教導和鉆研程度而舉辦的大型比賽和學術(shù)運動，通過供給一個標準任務來增進散播式人工智能、智能機器人技巧、及其相干領(lǐng)域的鉆研與發(fā)展。訓練和制作機器人進行足球賽，是當前人工智能和機器人領(lǐng)域的鉆研熱門之一。在比賽中，當斷定了球隊的陣型后，每個隊員分配了相應的角色，起頭討論球隊的整體和局部攻防戰(zhàn)術(shù)。

全隊進攻戰(zhàn)術(shù)

全隊進攻戰(zhàn)術(shù)是指比賽中一方獲得球后，通過隊員之間的傳遞配合達到射門的目標而采納的配合法子。與局部進攻戰(zhàn)術(shù)相對比，全隊進攻戰(zhàn)術(shù)的進攻面對比廣，參加進攻和快速回擊等。首要有邊路進攻，中路進攻，快速回擊等。

1、邊路進攻：利用球場兩側(cè)地區(qū) 發(fā)起進攻的法子叫做邊路進攻。邊路進攻是全隊進攻戰(zhàn)術(shù)的首要情勢之一，其首要特性是有利于施展進攻速度，打破對方防線制作缺口。

2、中路進攻：中路進攻是利用球場中間區(qū)域組織的進攻，這種進攻雖然能直接射門，但難度最大，因為中路防守最為縝密，突前的攻擊手必須是反應極其敏銳，意識強而且技巧高，敢于冒險，速度快和氣于路位策應的隊員。

3、快速回擊：比賽中當攻方進攻時，后衛(wèi)線往往壓至中場左近，防守人數(shù)也由于插上進攻和助攻而相對減少，此時抓住對方防區(qū)空隙對比大和回防較慢的時機，趁其失球發(fā)動快速回擊，往往能取得良好的效果，快速回擊是最有要挾的進攻手法，有效發(fā)動快速回擊。能有效得分，但其有必然的冒險性。所以要控制正確快速的原則。配合要有組織性，要非常有默契，需要多次練習。否則很難在比賽中實行。

全隊防守戰(zhàn)術(shù)

防守戰(zhàn)術(shù)可分為兩種根基類型：盯人緊逼防守（人盯人防守），即在規(guī)定的領(lǐng)域內(nèi)盯人緊逼，不交換看守：區(qū)域緊逼防守（盯人和區(qū)域相聯(lián)合），即現(xiàn)今風行的綜合防守，緊逼和保護相聯(lián)合，在個人的防區(qū)內(nèi)緊逼，作交替看守。盯人防守即各自都有明確的防守對象。防守最根本的原則是緊逼和保護。只有緊逼才干有效地主動斷搶，壓抑對方技巧的優(yōu)勢而獲得主動權(quán)：保護是為了更好地緊逼和把持空檔，為博得比賽籌辦機會。防守可以被解釋成一個安排的事件。在清華設計地隊伍中它是應用一個類型，基于情況的策略安排理論。安排最首要的一點是在根基的編隊中，哪個斷定一個隊員的地位通過標準的角色分配，球的地位和球的把持狀態(tài) 。在這個防守問題上，根基的信息供給作為一個標準，命名的，一個雷同的角色，因為角色分配和任務評價。另外一個首要的事實是在防守的地位機動性，這個測量多么危險，如果一個對手站在給定的地位。防守地位機動性因為任意的點在球場上的是先前已經(jīng)知道在所有的隊友中間。

四種類型的防守動作：

1、lock(陰礙 )：交叉一個對手的占領(lǐng)這個球在我們球門的外圍，禁止他向前推動。

2、Press(壓力)：跑，在一個對手占領(lǐng)這個球，并且在我們球門的左近，維持對他有要挾
3、Mark(盯人)：盯住一個沒有球的對手，因此他的隊友不可以傳球給他
4、Point Defend(地位防御)：站在根基的信息地位，這個將有利益，當一個左近的隊友在1vs1中失敗了，或者當這個隊重新奪回了球的把持權(quán)。

為了簡化這個問題，我們設置一個規(guī)矩，一個防守隊員不可以防守兩個對手在雷同的光陰里面，還有兩個防守隊友不該當防守雷同的對手。這個互斥的操作被供給在雷同的這些情況下。這個沖突的操作沒有在這里應用。那里有一個二中擇一，就是block和press被設置成沖突，替代了互斥，供給一個不同的防守策略。因此另外一個也是可以的，我們不再進一步深入討論。在分解一個防守任務到防守每個進攻的對象，和站在根基的信息點，布置被產(chǎn)生通過鏈接每個防守隊員到每個子任務。那時候，這個程序達到一個評價個體的效用。

我們定義了一個評價函數(shù)為了每種類型的動作。這些變量被用來每個評價函數(shù)的輸入：猛烈，測量光陰間隔從隊員的當前地位到防守地位，背離，測量距離從防守的點到隊員的根基的編隊地位，要挾，也就是這個防守地位機動性對手當前的地位。這個函數(shù)輸出增加隨著要挾和減小隨著距離和背離。為了點防守，只有要挾作為輸入。為了獲得每個函數(shù)的實際的值，我們設置一些范例的情景，從他們之間摘錄輸入值，然后賦予輸出值到這個函數(shù)。這個值被警惕的裝入來維持輕微的變更。在這個法子下，一個輸入和輸出的列表數(shù)據(jù)就生成了。

在清華設計中，他們應用 BP網(wǎng)絡神經(jīng)去編碼評價函數(shù)。這個列表產(chǎn)生被應用作為訓練網(wǎng)絡神經(jīng)的設置。在訓練之后，網(wǎng)絡被測試去確保他們適宜在先前的段中請求的，因此評價函數(shù)就斷定了，但我們隊伍還在改善中。剩下的企圖到一個標準的程序現(xiàn)在上面和沒有需要更進一步的討論。還留下一個補救企圖的產(chǎn)生。有時候這個隊保持一致失敗了。例如，當一個對手和兩個防守隊員的地位的距離雷同，而且在雷同的光陰里面。編隊的點。這兩個布置將有類似的評價，這兩個防守隊員可能沖突。我們的設計利用這個絕對的反饋存在這個系統(tǒng) 中。因為球?qū)⒕S持移動在這個比賽中，和對手必須向前移動去進攻，另外這個根基的信息地位或者防守的點將轉(zhuǎn)變在下個周期。那里有一個小小的轉(zhuǎn)變使得這兩個布置仍然維持雷同的評價。一旦這兩個布置不同的時候足夠明顯為兩個防守隊員去分手出來。這個預先防守隊員將履行這個防守動作，更接近的移動到對手。然后另外一個將移動到另外一個方向。因此，這個對照增加，這個系統(tǒng) 提取一個狀態(tài) 分手來自先前的進退兩難的局面。因此又可以完成一致了。

防守算法的實現(xiàn)

1、防守算法的初始想法

第一步：找球的地位，即時更新

第二步：確定球是否在可踢領(lǐng)域：

如果可踢，則根據(jù) 自己所在的地位作出相應的動作，具體是：

如果再罰球去內(nèi)，馬上把球踢出去，且盡量傳給隊友；如果再罰球區(qū)外，可以適當的帶球，把球送往中場；

如果不可踢，則進入第三步；

第三步：確定自己是不是有責任去斷球：

有，則毫不躊躇的去斷球，斷球也要分區(qū)域，在罰球區(qū)，則要以全力跑過去斷球，如果身后有自己的隊友，則可以考慮鏟球，如果自己在進攻球員的后面（他已經(jīng)過了我），則要馬上從后面鏟球；

沒有，則要進行協(xié)防，進入第四步；

第四步：是協(xié)防，這步我感覺是最難的，因為這種情況太多了，現(xiàn)在只有大概的一點思想：還是要把后半場分區(qū)，針對各區(qū)采納各種mark策略

第五步：根據(jù) 隊形調(diào)劑自己的地位