Android

พลังบอทของ openai ที่เอาชนะ dendi คืออะไร

Black^ Beats OpenAI Bot - Humanity is saved Dota 2

Black^ Beats OpenAI Bot - Humanity is saved Dota 2

สารบัญ:

Anonim

เมื่อสัปดาห์ที่แล้วประวัติศาสตร์ถูกสร้างขึ้นในอาณาจักรแห่ง Dota 2 และ AI ที่ The International นั้น Dendi หนึ่งในผู้เล่นที่ดีที่สุดของเกมถูกตีอย่างไร้ความปราณีใน 1v1 โดยบอทสองครั้งติดต่อกัน บอทที่เป็นปัญหานั้นทำโดย OpenAI ซึ่งเป็นจุดเริ่มต้นของ Elon Musk

ตอนนี้คุณอาจมีคำถาม Dota คืออะไร OpenAI คืออะไร และทำไมสิ่งนี้ถึงสำคัญ? เริ่มต้นด้วย Dota เป็นเกม MOBA แบบเล่นฟรีที่คุณควบคุม Heroes และเป้าหมายของคุณคือทำลายฝ่ายตรงข้าม โบราณ แฟน ๆ Dota หลายคนอาจจะรู้สึกผิดกับประโยคสุดท้ายเพราะมีมากพอที่ Dota จากนั้นฉันก็สรุป

เกมนี้มีความซับซ้อนมากและมีการเรียนรู้ที่สูงชันมาก ฉันลงมือปฏิบัติภารกิจเพื่อเรียนรู้ Dota เมื่อไม่นานมานี้และใช้เวลาหนึ่งสัปดาห์กว่าจะผ่านวิดีโอ How To พื้นฐานที่พวกเขาอธิบายกลยุทธ์ของเกมอาวุธอะไรคาถาฮีโร่ทำและวิธีการครีพ และสิ่งนี้ทำให้การต่อสู้ของ AI และ Dendi ทั้งหมด มีความสำคัญเพราะมันแสดงให้เห็นว่า AI และ ML ขั้นสูงได้กลายเป็นอย่างไร ดังนั้นเรามาดูกันว่ากำลังขับเคลื่อนบอทนั้นคืออะไรและเราจำเป็นต้องกลัวการลุกขึ้นสู้ของ AI หรือไม่

การเพิ่มขึ้นของโลกของ AI

AI กำลังกลายเป็น Skynet เป็นปัญหาที่ถกเถียงกัน Elon Musk เชื่อว่าหากไม่ได้รับการตรวจสอบสถานการณ์ Skynet เช่นนั้นน่าจะเกิดขึ้น ในทางกลับกัน Mark Zuckerberg กล่าวว่า AI นั้นไม่เป็นอันตรายและจะไม่ทำให้เกิด Doomsday Scenario Elon Musk เริ่ม OpenAI โดยมีเป้าหมายนี้

เพื่อป้องกันการใช้ AI ในทางที่ผิดและการวิจัยเกี่ยวกับ AI ซึ่งจะไม่ทำให้เราเป็นฝ่ายผิด และฉันก็อยู่ข้างเขา

แต่นั่นไม่ใช่สิ่งที่เราอยู่ที่นี่เพื่อพูดคุย หัวข้อหลักคือการรู้ว่าอะไรคือพลังบอทที่ทำโดย OpenAI เพื่อทำความเข้าใจกับมันฉันอ่านบทความวิจัยและบล็อกเกี่ยวกับเรื่องนั้นและติดต่อเพื่อนของฉัน Anmol Sharma ซึ่งเป็นนักวิจัย AI & ML

เสริมการเรียนรู้

นี่คือชื่อของเทคโนโลยีที่อยู่เบื้องหลัง Dota bot ของ OpenAI แต่ก่อนที่เราจะเจาะลึกเราต้องเข้าใจว่า AI ทั่วไปหรือ AI เฉพาะในวิดีโอเกมทำงานอย่างไร AI เป็นคำศัพท์ทางบอร์ดที่ดีมากและมีหัวข้อมากมายเช่นการเรียนรู้ของเครื่องการเรียนรู้ลึกและเครือข่ายประสาทเทียม ในการนิยาม AI อย่างโหดร้ายเราสามารถพูดได้ว่าความสามารถของคอมพิวเตอร์ในการเรียนรู้จากข้อมูลและการตัดสินใจบนพื้นฐานของการเรียนรู้ ยิ่งเรียนรู้มากก็จะยิ่งเพิ่มความถูกต้องในการตัดสินใจ

มันแตกต่างจากบอทปกติอย่างไร?

บ็อตในวิดีโอเกมทั่วไปอาจดูเหมือนพวกเขาฉลาด แต่มันไม่ใช่รูปแบบที่แท้จริงของ AI บอทเหล่านี้เกือบทั้งหมดในเกมได้รับการตั้งโปรแกรมตาม. ถ้าหาก.. นี่.. จากนั้นข้อความนั้น พวกเขาเพียงทำตามคำแถลงและดำเนินการตามเงื่อนไขที่ระบุในคำแถลง

ด้านบนฉันได้แสดงตัวอย่างที่ง่ายมาก งบในเกมจริงมีความซับซ้อนมากขึ้นตามเงื่อนไขในเงื่อนไข ยิ่งคำแถลงเหล่านี้มีความชัดเจนและละเอียดมากเท่าไหร่บอทก็ยิ่งฉลาดขึ้นเท่านั้น

รางวัลและการลงโทษ

ใน AI lingo สิ่งที่เราเรียกว่าบอทนั้นรู้จักกันในชื่อ Agent เป้าหมายคือการทำให้ตัวแทนเรียนรู้ทุกสิ่งที่เราต้องการให้เรียนรู้ ตัวแทนเรียนรู้ด้วยวิธีการเดียวกับที่สุนัขของคุณเรียนรู้ผ่านการให้รางวัลและการลงโทษ เมื่อใดก็ตามที่ตัวแทนทำผิดก็จะถูกลงโทษและเมื่อใดก็ตามที่ทำการคาดเดาที่ถูกต้องหรือให้คำตอบที่ถูกต้องจะได้รับรางวัล ผ่านระบบนี้ตัวแทนเรียนรู้ที่จะเชื่อมโยงการกระทำที่ไม่ควรทำเพื่อหลีกเลี่ยงการลงโทษและดำเนินการ (หรือการกระทำที่คล้ายคลึงกัน) ซึ่งให้รางวัล

หากคุณคิดอย่างใกล้ชิดมันก็เหมือนกับการตัดสินใจตามเงื่อนไขบางอย่างเช่นอัลกอริทึมทำ ดังที่ฉันได้แสดงไว้ข้างต้นบอทเกมที่มาบนกระบอกระเบิดจะดำเนินการตามอัลกอริทึม อัลกอริทึมใน AI เห็นได้ชัดว่าซับซ้อนกว่านี้อย่างมากซึ่งทำให้ทั้งระบบมี ความฉลาด

มาที่บอท OpenAI ของเราตามผู้พัฒนาเกมได้เรียนรู้เกมทั้งหมดภายในเวลา 2 สัปดาห์ ตลอดระยะเวลา 2 สัปดาห์มันเป็นออนไลน์ 24 × 7 และเล่นกับสำเนาของตัวเอง นั่นเป็นเหตุการณ์สำคัญที่น่าทึ่งเมื่อพิจารณาถึงความซับซ้อนของเกมและความจริงที่ว่ามันสามารถเอาชนะ Dendi ได้

ทำไมรถยนต์ที่ไม่มีคนขับยังไม่ถึงที่นี่?

นี่เป็นหนึ่งในคำถามแรกที่โผล่ขึ้นมาในใจของฉันเมื่อฉันได้ยินเกี่ยวกับเหตุการณ์ทั้งหมดนี้ หากบอทสามารถเรียนรู้เกมดังกล่าวและฝึกฝนตัวเองให้ถึงจุดที่จะเอาชนะผู้เล่นระดับสูงได้ทำไมเราถึงยังคงควบคุมวงล้ออยู่ และนี่เป็นคำถามเดียวกันกับที่ฉันยิง นาย Anmol Sharma ซึ่งเป็นเพื่อนของฉันซึ่งทำการวิจัยเกี่ยวกับรถยนต์ที่ไม่มีการควบคุม นี่คือสิ่งที่เขาพูด

ในเกมนั้นพัฒนาโดยมนุษย์จำนวนของตัวแปรมีน้อย นอกจากนี้หากตัวแทน (บอท) ทำผิดพลาดการลงโทษที่แย่ที่สุดคือการขาดทุนรอบ ในโลกแห่งความจริงหนึ่งความผิดพลาดคือความตาย

ถึงแม้ว่า Dota จะเป็นเกมที่ซับซ้อนการผสมผสานของการเคลื่อนไหวคาถาและยุทธวิธีที่เป็นไปได้แม้ว่าจะยังคงมีขนาดใหญ่มากก็ตาม แต่ก็ยังมีข้อ จำกัด อยู่ และความผิดพลาดได้รับอนุญาตโดยไม่มีการลงโทษที่แท้จริง แต่ในกรณีที่เป็นตัวแทนผู้ขับขี่รถยนต์น้อยกว่าความผิดพลาดอาจนำไปสู่อุบัติเหตุที่อันตรายและเสียชีวิตได้

ในโลกแห่งความเป็นจริงจำนวนตัวแปรที่เอเจนต์ต้องตรวจสอบนั้นไม่มีที่สิ้นสุดและสถานการณ์ที่เกิดขึ้นเนื่องจากตัวแปรเหล่านี้เช่นรถคันอื่นเปลี่ยนเลนการกระโดดบนทางเท้าด้านหน้ารถยนต์ก็ไม่มีที่สิ้นสุดเช่นกัน นอกจากนี้เมื่อ Jeremy Clarkson กล่าวไว้พวกเขาจะต้องทำการตัดสินใจทางศีลธรรมและจริยธรรมเมื่อใกล้จะเกิดอุบัติเหตุ (แม้ว่าทฤษฎีของเขาไม่ถูกต้องก็ตาม)

อนาคต

เรารู้แล้วว่าหุ่นยนต์ควบคุมโดยมนุษย์นั้นมีการผ่าตัดที่แท้จริง การก้าวกระโดดครั้งต่อไปคือหุ่นยนต์ที่ควบคุมโดย AI เพื่อทำการแสดง และนี่เป็นเพียงในด้านการแพทย์ AI จะเป็นเทคโนโลยีใหม่ที่โดดเด่นในทศวรรษหน้าในหลายสาขา แต่ AI ก็สามารถนำไปใช้ในทางที่ผิดเช่นการโจมตี DDoS, Ransomware Bots และแฮ็คพีซีหรือระบบอื่น ๆ ขององค์กร

ในส่วนที่เกี่ยวกับ Dota และเกมอื่น ๆ เราสามารถคาดหวังว่าจะได้เห็นบอทอัจฉริยะดังกล่าวสำหรับเกมอื่น ๆ เช่นกันซึ่งผู้เล่นสามารถฝึกฝนเพื่อให้ทำงานได้ดียิ่งขึ้น และฉันพูดถึง OpenAI จะทำ 5v5 ที่ International ปีหน้าหรือไม่? ดังนั้นฉันจึงเลิกแปรงทักษะ Dota ของฉันเพื่อเอาชนะบ็อตที่สร้างขึ้นอย่างน้อยที่สุด Divine Rapier ที่นี่ฉันมา!