- 相關(guān)推薦
盤算機仿真機器人世界杯足球錦標賽攻防戰(zhàn)術(shù)的鉆研
【摘要】隨著盤算機技巧的發(fā)展, 散播式人工智能中多智能體系統(tǒng) (MAS Multi-agent System)的理論及利用鉆研已經(jīng)成為人工智能鉆研的熱門,RoboCup(Robot World Cup),即機器人世界杯足球錦標賽,是一個在異步,有噪聲的對抗環(huán)境下,鉆研多智能體的決策和合作的問題。本文詳細介紹了盤算機仿真足球機器人比賽中進攻和防守的設計與實現(xiàn)。
【要害詞】進攻;組織性;正確 ;快速;防守;機動性
RoboCup(Robot World Cup),即機器人世界杯足球錦標賽。它是國際上一項為進步相干領(lǐng)域 的教導和鉆研程度而舉辦的大型比賽 和學術(shù)運動,通過供給一個標準 任務 來增進散播式人工智能、智能機器人技巧、及其相干領(lǐng)域 的鉆研與發(fā)展。訓練和制作機器人進行足球賽,是當前人工智能和機器人領(lǐng)域 的鉆研熱門之一。在比賽 中,當斷定了球隊的陣型后,每個隊員分配了相應的角色,起頭討論球隊的整體和局部攻防戰(zhàn)術(shù)。
全隊進攻戰(zhàn)術(shù)
全隊進攻戰(zhàn)術(shù)是指比賽 中一方獲得球后,通過隊員之間的傳遞配合達到 射門的目標而采納的配合法子 。與局部進攻戰(zhàn)術(shù)相對比,全隊進攻戰(zhàn)術(shù)的進攻面對比廣,參加 進攻和快速回擊等。首要有邊路進攻,中路進攻,快速回擊等。
1、邊路進攻:利用 球場兩側(cè)地區(qū) 發(fā)起進攻的法子 叫做邊路進攻。邊路進攻是全隊進攻戰(zhàn)術(shù)的首要情勢之一,其首要特性是有利于施展進攻速度,打破對方防線制作缺口。
2、中路進攻:中路進攻是利用 球場中間區(qū)域組織的進攻,這種進攻雖然能直接射門,但難度最大,因為中路防守最為縝密,突前的攻擊手必須 是反應極其敏銳 ,意識強而且技巧高,敢于冒險,速度快和氣于路位策應的隊員。
3、快速回擊:比賽 中當攻方進攻時,后衛(wèi)線往往壓至中場左近,防守人數(shù)也由于插上進攻和助攻而相對減少,此時抓住對方防區(qū)空隙對比大和回防較慢的時機,趁其失球發(fā)動 快速回擊,往往能取得良好的效果 ,快速回擊是最有要挾的進攻手法,有效發(fā)動 快速回擊。能有效得分,但其有必然的冒險性。所以要控制正確快速的原則。配合要有組織性,要非常有默契,需要 多次練習。否則很難在比賽 中實行。
全隊防守戰(zhàn)術(shù)
防守戰(zhàn)術(shù)可分為兩種根基類型:盯人緊逼防守(人盯人防守),即在規(guī)定的領(lǐng)域內(nèi)盯人緊逼,不交換 看守:區(qū)域緊逼防守(盯人和區(qū)域相聯(lián)合),即現(xiàn)今風行的綜合防守,緊逼和保護相聯(lián)合,在個人的防區(qū)內(nèi)緊逼,作交替看守。盯人防守即各自都有明確 的防守對象。防守最根本 的原則是緊逼和保護。只有緊逼才干有效地主動 斷搶,壓抑對方技巧的優(yōu)勢而獲得主動 權(quán):保護是為了更好地緊逼和把持空檔,為博得比賽 籌辦機會。防守可以被解釋 成一個安排 的事件。在清華設計地隊伍中它是應用一個類型,基于情況 的策略安排 理論。安排 最首要的一點是在根基的編隊中,哪個斷定一個隊員的地位通過標準 的角色分配,球的地位和球的把持狀態(tài) 。在這個防守問題上,根基的信息供給作為一個標準 ,命名的,一個雷同的角色,因為角色分配和任務 評價。另外一個首要的事實是在防守的地位機動性,這個測量多么危險,如果一個對手站在給定的地位。防守地位機動性因為任意的點在球場上的是先前已經(jīng)知道在所有的隊友中間。
四種類型的防守動作:
1、lock(陰礙 ):交叉一個對手的占領(lǐng)這個球在我們球門的外圍,禁止他向前推動。
2、Press(壓力):跑,在一個對手占領(lǐng)這個球,并且在我們球門的左近,維持對他有要挾
3、Mark(盯人):盯住一個沒有球的對手,因此他的隊友不可以傳球給他
4、Point Defend(地位防御):站在根基的信息地位,這個將有利益,當一個左近的隊友在1vs1中失敗了,或者當這個隊重新奪回了球的把持權(quán)。
為了簡化這個問題,我們設置一個規(guī)矩,一個防守隊員不可以防守兩個對手在雷同的光陰里面,還有兩個防守隊友不該當防守雷同的對手。這個互斥的操作被供給在雷同的這些情況 下。這個沖突的操作沒有在這里應用。那里有一個二中擇一,就是block和press被設置成沖突,替代了互斥,供給一個不同的防守策略。因此另外一個也是可以的,我們不再進一步深入 討論。在分解一個防守任務 到防守每個進攻的對象,和站在根基的信息點,布置被產(chǎn)生 通過鏈接每個防守隊員到每個子任務 。那時候,這個程序達到一個評價個體的效用。
我們定義了一個評價函數(shù)為了每種類型的動作。這些變量被用來每個評價函數(shù)的輸入:猛烈,測量光陰間隔從隊員的當前地位到防守地位,背離,測量距離從防守的點到隊員的根基的編隊地位,要挾,也就是這個防守地位機動性對手當前的地位。這個函數(shù)輸出增加隨著要挾和減小隨著距離和背離。為了點防守,只有要挾作為輸入。為了獲得每個函數(shù)的實際的值,我們設置一些范例的情景,從他們之間摘錄輸入值,然后賦予輸出值到這個函數(shù)。這個值被警惕的裝入來維持輕微的變更。在這個法子 下,一個輸入和輸出的列表數(shù)據(jù)就生成了。
在清華設計中,他們應用 BP網(wǎng)絡神經(jīng)去編碼評價函數(shù)。這個列表產(chǎn)生 被應用作為訓練網(wǎng)絡神經(jīng)的設置。在訓練之后,網(wǎng)絡被測試去確保他們適宜在先前的段中請求的,因此評價函數(shù)就斷定了,但我們隊伍還在改善中。剩下的企圖 到一個標準 的程序現(xiàn)在上面和沒有需要 更進一步的討論。還留下一個補救企圖 的產(chǎn)生 。有時候這個隊保持一致失敗了。例如,當一個對手和兩個防守隊員的地位的距離雷同,而且在雷同的光陰里面。編隊的點。這兩個布置將有類似的評價,這兩個防守隊員可能沖突。我們的設計利用 這個絕對的反饋存在這個系統(tǒng) 中。因為球?qū)⒕S持移動在這個比賽 中,和對手必須 向前移動去進攻,另外這個根基的信息地位或者防守的點將轉(zhuǎn)變在下個周期。那里有一個小小的轉(zhuǎn)變使得這兩個布置仍然維持雷同的評價。一旦這兩個布置不同的時候足夠明顯 為兩個防守隊員去分手 出來。這個預先防守隊員將履行這個防守動作,更接近的移動到對手。然后另外一個將移動到另外一個方向。因此,這個對照 增加,這個系統(tǒng) 提取一個狀態(tài) 分手來自先前的進退兩難的局面 。因此又可以完成一致了。
防守算法的實現(xiàn)
1、防守算法的初始想法
第一步:找球的地位,即時更新
第二步:確定 球是否在可踢領(lǐng)域:
如果可踢,則根據(jù) 自己所在的地位作出相應的動作,具體是:
如果再罰球去內(nèi),馬上把球踢出去,且盡量傳給隊友;如果再罰球區(qū)外,可以適當 的帶球,把球送往中場;
如果不可踢,則進入第三步;
第三步:確定 自己是不是有責任 去斷球:
有,則毫不躊躇的去斷球,斷球也要分區(qū)域,在罰球區(qū),則要以全力跑過去斷球,如果身后有自己的隊友,則可以考慮 鏟球,如果自己在進攻球員的后面(他已經(jīng)過了我),則要馬上從后面鏟球;
沒有,則要進行協(xié)防,進入第四步;
第四步:是協(xié)防,這步我感覺是最難的,因為這種情況 太多了,現(xiàn)在只有大概的一點思想:還是要把后半場分區(qū),針對各區(qū)采納各種mark策略
第五步:根據(jù) 隊形調(diào)劑自己的地位
2、防守算法的實現(xiàn)流程:
|-->如果沒有開球:
| |-->如果是本方開球且球員自己是9號:
| | |->如果球在可踢領(lǐng)域:則以最大力把球kick出去;
| | |->如果球不可踢: 則搶斷;
| |-->如果當前隊形不是初始化隊形或者球員自己的實際地位偏離隊形規(guī)定地位(以下稱為策略地位)1m以上:則導入初始隊形,球員直接移到自己的策略地位;
| |-->如果是7號或者8號:則籌辦移動到9號kickto的點,并把頭轉(zhuǎn)向球;
| |-->其他情況 :則把身材對向(0,0),并把頭轉(zhuǎn)向球;
|-->如果已開球:則先導入防守的433隊形,
| |-->如果球的信息不是最新的:則搜索球,并轉(zhuǎn)動頭以助以尋找;
| |-->如果球在可踢領(lǐng)域:
| | |-->如果在球員自己的罰球區(qū):則以最大力把球以相對安全的角度kick出罰球區(qū);
| | |-->如果在自己前方5m,角度為(-80,80)的扇形區(qū)域內(nèi)有對方球員:則以最大力把球轉(zhuǎn)移,即ClearBall;
| | |-->如果在自己前方5m,角度為(-80,80)的扇形區(qū)域內(nèi)沒有對方球員 :則以不大的力把球kick出去;
| | |-->其他:則帶球前進;
| |-->如果球員自己是隊友中最快可以達到球的地位的球員,即球員自己最有責任 斷球:
| | |-->如果球正被對方帶向球門:
| | | |-->如果球員自己和球的距離小于2。5m:則鏟球;
| | | |-->否則:則加速跑向球;
| | |-->否則:則搶斷;
| |-->如果球員自己的當前地位偏離他的策略地位(1。5+(球員與球的距離)/10。0)m:則即時調(diào)劑自己的地位;
| |-->如果球員在自己的半場:則進入mark狀態(tài) ,
| | |-->如果球員在自己的罰球區(qū)內(nèi):則采納 MARK_GOAL 的mark法子 (防止被防球員接球射門);
| | |-->如果球員在自己罰球區(qū)兩側(cè):則采納 MARK_BISECTOR 的mark法子 (既防止被防球員接球,又防止其接球射門);
| | |-->在其他區(qū)域 :則采納 MARK_BALL 的mark法子 (防止被防球員接球);
| |-->如果球員自己與球的相對角度大于1:則把身材轉(zhuǎn)向球,并把頭轉(zhuǎn)向球;
| |-->其他情況 :轉(zhuǎn)頭(觀察);
注:以上的流程遇到“;”就返回,得到一個soc(命令),最后將soc返回。
【參考文獻】
[1]李實、徐旭明、葉榛、孫增圻編著,《綜述:國際機器人足球比賽 及其相干技巧》,清華大學盤算機系國家 智能技巧與系統(tǒng) 重點實驗 室,1999 年。
[2]孫增圻、李實編著,《RoboCup 與智能主動化》,清華大學盤算機科學與技巧系,1999 年。
【盤算機仿真機器人世界杯足球錦標賽攻防戰(zhàn)術(shù)的鉆研】相關(guān)文章:
OFDM技術(shù)研究及其系統(tǒng)仿真05-11
MATLAB正交振幅調(diào)制解調(diào)仿真分析(一)05-11
免費盤磨機傳動裝置(一)05-13
無線傳感網(wǎng)SCRP協(xié)議的設計和仿真05-11
淺析本屆世界杯進球少的原因05-29
我國氣壓盤式制動結(jié)構(gòu)性能和前景分析05-11
足球課題開題報告(精選6篇)04-24
計算機開題報告08-26
計算機應用論文02-15
計算機教學論文11-02