Uncategorized

AI Poker Bot Pluribus ชนะมือโปรอันดับต้น ๆ ใน NLHE Multiplayer เพียง 144 เหรียญเท่านั้นในการรัน



บอทใหม่ล่าสุดสำหรับการเล่นโป๊กเกอร์ได้รับการพัฒนาโดยนักวิจัยกลุ่มเดียวกับที่เปิดตัว Libratus ในปี 2017 และในครั้งนี้พวกเขาเอาชนะทีมผู้เล่นโป๊กเกอร์ที่โดดเด่นได้สำเร็จในการแข่งขัน NLHE 6 มือ Facebook ทำงานร่วมกับนักวิจัยของมหาวิทยาลัย Carnegie Mellon ซึ่งนำโดยศาสตราจารย์มหาวิทยาลัย CMU Tuomas Sandholm และนักศึกษาระดับบัณฑิตศึกษาของเขา Noam Brown ผู้วางแผนการประลองด้วยซูเปอร์คอมพิวเตอร์โป๊กเกอร์ AI เวอร์ชันล่าสุดที่เรียกว่า “Pluribus” กับผู้เล่นโป๊กเกอร์ที่ดีที่สุดในอุตสาหกรรม และผลการวิจัยที่ตีพิมพ์เมื่อต้นเดือนที่ผ่านมาในนิตยสาร Science นั้นน่าทึ่งมาก บอทสามารถเอาชนะคู่ต่อสู้ได้ซึ่งเป็นสิ่งที่ AI อื่นไม่เคยทำได้มาก่อน (โปรแกรม AI ก่อนหน้านี้สามารถชนะได้ในเกมโป๊กเกอร์ที่มีผู้เล่นสองคนเท่านั้น) ผลของโครงการนี้คาดว่าจะมีผลกระทบที่สำคัญสำหรับการวิจัย AI และเกมโป๊กเกอร์เอง Two TrialsPoker ถือเป็นเกมที่รวบรวมความท้าทายของข้อมูลที่ซ่อนอยู่ได้เป็นอย่างดีดังนั้นนักวิจัยจึงใช้มันเป็นความท้าทายในการสร้างและพัฒนาปัญญาประดิษฐ์ อย่างไรก็ตามไม่มีเครื่องจักรใดสามารถเอาชนะผู้เล่นที่เป็นมนุษย์ได้ในการตั้งค่าผู้เล่นหลายคนแบบเท็กซัสโฮลด์เอ็มแบบไม่ จำกัด (รูปแบบที่ได้รับความนิยมมากที่สุดในเกมโป๊กเกอร์) จนกระทั่ง Pluribus มาถึง Pluribus ต่อสู้กับมือโปรโป๊กเกอร์ที่ดีที่สุดในรูปแบบ NLHE 6-max ผู้เชี่ยวชาญคือผู้เชี่ยวชาญ 6-max ที่ได้รับรางวัลอย่างน้อย 1 ล้านดอลลาร์ในอาชีพโป๊กเกอร์มืออาชีพ พลูริบัสถูกทดสอบสองครั้ง ในการทดลองครั้งแรกมนุษย์ห้าคนและ AI หนึ่งตัว (5H + 1AI) ถูกเจาะกันเองในขณะที่ในการทดลองครั้งที่สองมีมนุษย์เพียงคนเดียวที่เผชิญหน้ากับร่างโคลนพลูริบัส 5 ตัว (1H + 5AI) โดยคำนึงว่าบอทไม่ได้รับอนุญาตให้สื่อสาร และไม่รู้ว่าพวกเขากำลังเล่นกับใครจึงป้องกันการสมรู้ร่วมคิดใด ๆ Win for Pluribus ผลการทดลองทั้งสองครั้งพบว่าอัตราการชนะของ Pluribus สูงกว่าผู้เล่นโป๊กเกอร์ที่เป็นมนุษย์อย่างมีนัยสำคัญ ผู้เล่นบางคนที่เข้าร่วมการทดลอง ได้แก่ Anthony Gregg, Dong Kim, Greg Merson, Jacob Toole, Jason Les, Jimmy Chou, Linus Loeliger, Michael Gagliano, Nick Petrangelo, Sean Ruane, Seth Davies และ Trevor Savage โดยผู้เล่นแต่ละคน ใช้ชื่อเล่นระหว่างเกม ในการทดลอง 5H + 1AI มีการเล่นทั้งหมด 10,000 มือในช่วง 12 วันในขณะที่ในการทดสอบ 1H + 5AI ผู้เล่นโป๊กเกอร์ Darren Elias และ Chris Ferguson เล่น 5,000 มือต่อสำเนา Pluribus 5 เล่ม เมื่อนับผลลัพธ์พบว่าบอทสามารถเอาชนะมนุษย์ได้ในราคาประมาณ 5 ดอลลาร์ต่อมือและเกือบ 1,000 ดอลลาร์ต่อชั่วโมงตามโพสต์บล็อก Facebook AI ของ Noam Brown Pluribus vs Pro Demo Video: สิ่งที่ผู้เชี่ยวชาญในโป๊กเกอร์คิดเกี่ยวกับ AI Pluribus นี่คือสิ่งที่ผู้เข้าร่วมการทดลองบอทโป๊กเกอร์ล่าสุดกล่าว Seth Davies: “สิ่งที่ท้าทายที่สุดในการเล่น Pluribus คือการตอบสนองต่อกลยุทธ์พรีฟล็อปที่ซับซ้อนของเขาซึ่งแตกต่างจากมนุษย์ Pluribus ใช้การยกระดับพรีฟล็อปหลาย ๆ มิติการพยายามตอบสนองต่อช่วงเปิดที่ไม่ใช่เชิงเส้นถือเป็นความท้าทายที่น่าสนุกซึ่งแตกต่างจากเกมของมนุษย์” Jason Les: “มันเป็นความผิดพลาดที่น่ากลัวอย่างแท้จริงฉันว่ามันเป็นการต่อสู้ที่มีประสิทธิภาพมากกว่ามนุษย์ทั่วไปมากและนั่นคือสิ่งที่ทำให้ยากที่จะเล่นกับคุณคุณมักจะอยู่ในสถานการณ์ที่มีความกดดันมากมายจน AI ใส่แล้วคุณรู้ว่ามีโอกาสมากที่เขาจะบลัฟที่นี่ ” Jimmy Chou: “ทุกครั้งที่ฉันเล่นบอทฉันรู้สึกเหมือนกำลังหยิบอะไรใหม่ ๆ มารวมเข้ากับเกมของฉันในฐานะมนุษย์ฉันคิดว่าเรามีแนวโน้มที่จะทำให้เกมง่ายขึ้นด้วยตัวเราเองทำให้กลยุทธ์ที่จะนำมาใช้และจดจำได้ง่ายขึ้น บอทไม่ยอมรับทางลัดใด ๆ เหล่านี้และมีโครงสร้างเกมที่ซับซ้อน / สมดุลมากสำหรับทุกการตัดสินใจ “คริสเฟอร์กูสัน:” พลูริบัสเป็นคู่ต่อสู้ที่เล่นได้ยากมากมันยากมากที่จะบล็อกมันด้วยมือประเภทใดก็ได้ เขาเก่งมากในการเดิมพันมูลค่าต่ำในแม่น้ำเขาเก่งมากในการดึงคุณค่าจากมือที่ดีของเขา ” Darren Elias: “มันเป็นแค่ตัวฉันและจากนั้นก็มีบอทโป๊กเกอร์ AI ห้าเวอร์ชันที่ฉันเล่นทุกวันเป็นพัน ๆ มือเขาพัฒนาขึ้นอย่างรวดเร็วตั้งแต่การเป็นผู้เล่นระดับปานกลางไปจนถึงผู้เล่นระดับโลก – ผู้เล่นโป๊กเกอร์ระดับโป๊กเกอร์ในเวลาไม่กี่วันและหลายสัปดาห์ซึ่งค่อนข้างน่ากลัว “Pluribus in a Nutshell สำหรับตอนนี้มันปลอดภัยที่จะกล่าวได้ว่าหนึ่งในผู้เล่นโป๊กเกอร์ที่ดีที่สุดในโลกไม่มีหน้าโป๊กเกอร์ แกนกลางของ Pluribus หรือพิมพ์เขียวเชิงกลยุทธ์ถูกสร้างขึ้นจากการเล่นเองหรือแข่งขันกับร่างโคลน นี่เป็นวิธีเดียวกับที่ใช้ในการสร้าง OpenAI Five ซึ่งเป็นทีมของเครือข่ายประสาทเทียม 5 เครือข่ายที่ฝึกฝนมาเป็นเวลาเทียบเท่า 45,000 ปีและสามารถเอาชนะทีม eSports มืออาชีพในวิดีโอเกม Dota 2 ได้ Pluribus ได้รับการสอนตั้งแต่เริ่มต้นโดยใช้ประเภท ของการเรียนรู้แบบเสริมกำลังเช่นเดียวกับ Go AI ของ DeepMind AlphaZero เริ่มต้นด้วยการเล่นโป๊กเกอร์แบบสุ่มและปรับปรุงเมื่อคุณพิจารณาว่าการกระทำใดทำเงินได้มากที่สุด หลังจากแต่ละมือจำวิธีที่เขาเล่นและประเมินว่าเขาจะทำเงินได้มากขึ้นด้วยการกระทำที่แตกต่างกันหรือไม่เช่นการเพิ่มแทนที่จะยึดติดกับการเดิมพัน หากทางเลือกอื่นนำไปสู่ผลลัพธ์ที่ดีกว่าเขามักจะเลือกสิ่งเหล่านั้นในสถานการณ์ในอนาคต การเล่นโป๊กเกอร์กับตัวเองนับล้านล้าน Pluribus ได้กำหนดกลยุทธ์พื้นฐานที่เขาทำตามในการแข่งขัน สำหรับทุกการตัดสินใจของเขา Pluribus จะเปรียบเทียบสถานะของเกมกับโปรเจ็กต์ของเขาและวางแผนการเคลื่อนไหวเล็กน้อยเพื่อดูว่าเกมจะออกมาเป็นอย่างไร จากนั้นเขาจะตัดสินใจว่าจะปรับปรุงได้หรือไม่ ด้วยการเรียนรู้ด้วยตัวเองโดยไม่มีการป้อนข้อมูลจากมนุษย์ Pluribus ใช้กลยุทธ์บางอย่างที่นักเล่นเกมมนุษย์คิดไม่ถึงว่าจะใช้ ความสำเร็จของพลูริบัสส่วนใหญ่เกิดจากประสิทธิภาพ เมื่อเล่นโป๊กเกอร์มันจะทำงานบนหน่วยประมวลผลกลาง (ซีพียู) สองหน่วยเท่านั้นซึ่งแตกต่างจาก 100 CPU ของ Libratus และ Go bot ดั้งเดิมของ DeepMind ซึ่งใช้ CPU เกือบ 2,000 ตัวเมื่อพวกเขาเอาชนะผู้เล่นมืออาชีพอันดับต้น ๆ เมื่อพลูริบัสเล่นกับตัวเองเขาเล่นมือในเวลาประมาณ 20 วินาทีเร็วกว่าผู้เล่นอาชีพที่เป็นมนุษย์ประมาณสองเท่า สิ่งที่ยอดเยี่ยมอีกอย่างเกี่ยวกับ Pluribus คือซอฟต์แวร์ทำงานบนเซิร์ฟเวอร์คลาวด์ซึ่งมีราคาเพียง 144 เหรียญเท่านั้นในการทำงาน สำหรับการเปรียบเทียบ Libratus ใช้พลังงานจากซูเปอร์คอมพิวเตอร์มูลค่า 9.65 ล้านดอลลาร์ซึ่งมีราคาแพงมากในการทำงาน แน่นอนว่าการทดลองนี้ไม่ได้จบลงแค่โป๊กเกอร์เท่านั้น แม้ว่าจะเป็นความสำเร็จที่ยิ่งใหญ่อย่างแท้จริงที่สามารถเอาชนะมืออาชีพโป๊กเกอร์ที่เก่งที่สุดในเกมหกมือได้ แต่ก็พิสูจน์ให้เห็นว่าพลังในการประมวลผลของมันสามารถตอบสนองวัตถุประสงค์อื่นที่ไม่ใช่การเล่นไพ่ ผลการวิจัยยืนยันว่า AI สามารถทำงานในระดับ “ ยอดมนุษย์ ” ในสถานการณ์หลายฝ่ายโดยมีการเข้าถึงข้อมูลที่ จำกัด และสามารถนำไปใช้ได้ทุกที่ตั้งแต่วาณิชธนกิจและกลยุทธ์การซื้อขายไปจนถึงเทคโนโลยีรถยนต์ขับเคลื่อนด้วยตนเอง ตอนนี้ Pluribus เข้าร่วมในเกมอย่าง Chess and Go ซึ่งเป็นสองเกมที่ผู้เล่นที่เป็นมนุษย์ที่ดีที่สุดในโลกพ่ายแพ้ด้วยปัญญาประดิษฐ์ ที่มา: https: //science.sciencemag.org/content/early/2019/07/10/science.aay2400


คาสิโน888
คาสิโน88
เกม คาสิโน
เกมส์ คาสิโน
ts911 คาสิโน ออนไลน์