Car-tech

ระบบการรู้จำเสียงจะต้องฉลาดกว่านี้ศาสตราจารย์ Says

पृथà¥?वी पर सà¥?थित à¤à¤¯à¤¾à¤¨à¤• नरक मंदिर | Amazing H

पृथà¥?वी पर सà¥?थित à¤à¤¯à¤¾à¤¨à¤• नरक मंदिर | Amazing H
Anonim

เกลียดการพูดคุยทางโทรศัพท์กับระบบรู้จำเสียงพูดโดยอัตโนมัติอาจใช้ความปลื้มปีติในความจริงที่ว่านักวิทยาศาสตร์กำลังทำงานเพื่อทำให้ระบบดังกล่าวมีชีวิตชีวาและน่ารำคาญน้อยกว่าการใช้งาน

"จากประสบการณ์ของผู้บริโภคพบว่าระบบเหล่านี้น่าผิดหวังมาก" อัลเลนซึ่งเป็นประธานฝ่ายวิทยาการคอมพิวเตอร์ที่มหาวิทยาลัยโรเชสเตอร์พูดก่อนการประชุม SpeechTEK 2010 ซึ่งจัดขึ้นที่นิวยอร์กในสัปดาห์นี้

ระบบจดจำเสียงพูดด้วยระบบคอมพิวเตอร์ส่วนใหญ่สามารถเข้าใจสิ่งที่มนุษย์พูดได้ถึง 98 เปอร์เซ็นต์ของเวลา, และยังคนยังคงข่มขู่ที่ใช้ระบบโทรศัพท์ช่วยอัตโนมัติโทรศัพท์. กุญแจสำคัญในการทำให้ระบบเหล่านี้ไม่สร้างความรำคาญในการใช้งานจะทำให้พวกเขาเข้าใจภาษาได้มากขึ้นและทำให้พวกเขามีปฏิสัมพันธ์มากขึ้นอัลเลนกล่าวว่า

[อ่านเพิ่มเติม: พีซีใหม่ของคุณต้องการ 15 โปรแกรมที่ยอดเยี่ยมฟรี]

ตอนนี้แผนกบริการลูกค้าขององค์กรขนาดใหญ่ส่วนใหญ่มีระบบช่วยเหลือแบบใช้โทรศัพท์อัตโนมัติ ผู้ใช้เรียกหมายเลขช่วยเหลือและเสียงประดิษฐ์จะถามผู้โทรถึงชุดคำถาม ส่วนใหญ่ของระบบเหล่านี้จะขึ้นอยู่กับโครงสร้างที่มีต้นไม้ตัดสินใจขนาดใหญ่ ด้วยระบบดังกล่าว "คุณไม่ได้หาสิ่งที่คนต้องการคุณจะทำตามสคริปต์" เขากล่าว

ระบบเป็นจริงประกอบด้วยจำนวนของเทคโนโลยีที่แตกต่างกัน หนึ่งคือการจดจำเสียงพูดหรือความสามารถในการเข้าใจคอมพิวเตอร์หรือประสบความสำเร็จในการแปลเป็นข้อความสิ่งที่พูดได้ก็คือ

เทคโนโลยีอื่น ๆ การประมวลผลภาษาธรรมชาติ (NLP) พยายามแปลงข้อความของลำโพงเป็นคำสั่ง ที่คอมพิวเตอร์สามารถรันได้หรือสามารถสรุปได้สำหรับผู้ดำเนินการของมนุษย์

ก้าวที่ยิ่งใหญ่ได้รับการสร้างขึ้นมาในด้านการจดจำเสียงและ NLP ในช่วงสองสามทศวรรษที่ผ่านมา แต่ดูเหมือนว่าจะทำให้ผู้ใช้ของพวกเขารู้สึกหงุดหงิด "ฉันโทรหาธนาคารเพียงอย่างเดียวเมื่อฉันมีปัญหาและต่อสู้กับระบบเหล่านี้ [I ask] สิ่งที่ฉันสามารถตอบรับผ่านคนคนหนึ่งให้เร็วที่สุดเท่าที่จะเป็นไปได้" Allen กล่าว "งานวิจัยด้านวิชาการของอัลเลนได้รับ ในการหาวิธีที่ "เราสามารถพูดคุยกับเครื่องได้เช่นเดียวกับที่เราสามารถพูดคุยกับคนได้" เขากล่าว

บทสนทนาระหว่างคนสองคนสามารถทำได้อย่างแม่นยำในรูปแบบที่คอมพิวเตอร์มีปัญหาในการจับคู่ แอลเลนชี้ไปที่งานแรกที่เขาทำในฐานะนักศึกษาระดับบัณฑิตศึกษาซึ่งเขาได้บันทึกการสนทนาไว้ที่โต๊ะข้อมูลสถานีรถไฟ ในการปฏิสัมพันธ์หนึ่งผู้โดยสารเดินขึ้นไปที่บูธและพูดว่า "8:50 ถึงวินด์เซอร์" และผู้เข้าร่วมตอบ "ประตู 10, 20 นาทีล่าช้า" ในขณะที่ผู้เข้าร่วมประชุมทราบว่าข้อมูลที่ผู้สอบถามต้องการจะเป็นอย่างไรระบบคอมพิวเตอร์จะหาคำแถลงแรกของผู้โดยสารที่ไม่ติดขัด

วิธีที่อัลเลนเห็นว่าองค์ประกอบสององค์ประกอบขาดหายไปจากระบบสมัยใหม่คือความสามารถในการวิเคราะห์ว่าลำโพงพูดและอะไร ความสามารถในการพูดคุยกับผู้พูดเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับสิ่งที่ผู้พูดตั้งใจจะพูด

"ส่วนมากของ NLP แบบพกพามีแนวโน้มที่จะตื้นเราไม่มีเทคโนโลยีที่ให้ความสำคัญกับประโยค" เขาพูดว่า. เครื่องมือการประมวลผลทางสถิติและบริการคำจำกัดความเช่น WordNet สามารถช่วยกำหนดคำ แต่ยังเป็นความสัมพันธ์ของคำเพื่อให้ระบบรู้ว่าตัวอย่างเช่น "บริษัท ย่อย" เป็นส่วนหนึ่งของ "บริษัท "

ขึ้น การสื่อสารสองทางระหว่างผู้ใช้และคอมพิวเตอร์เป็นสิ่งที่จำเป็นด้วย เมื่อพูดถึงความต้องการของพวกเขาผู้คนอาจให้ข้อมูลตามลำดับโดยเฉพาะ ควรขึ้นอยู่กับคอมพิวเตอร์เพื่อรวมข้อมูลนี้เข้าไว้ด้วยกันและไม่ทำให้ผู้ใช้มีคำถามที่มีคำตอบอยู่แล้ว

"นี่คืออนาคตนี่คือสิ่งที่คุณต้องการให้ระบบดำเนินการและเราสามารถสร้างกล่องโต้ตอบได้ ระบบนี้สามารถรองรับความซับซ้อนได้ "เขากล่าว"

เพื่อแสดงให้เห็นถึงแนวคิดนี้อัลเลนและทีมนักวิจัยได้ออกแบบโปรแกรมที่เรียกว่า Cardiac ซึ่งสามารถเลียนแบบคำถามที่พยาบาลจะถามผู้ป่วยโรคหัวใจ โปรแกรมนี้สร้างขึ้นโดยได้รับเงินสนับสนุนจากสถาบันสุขภาพแห่งชาติสหรัฐฯ ด้วยระบบนี้เมื่อผู้ใช้ป้อนข้อมูลระบบจะไม่ขออีกครั้งอัลเลนกล่าว ระบบจะให้เหตุผลเกี่ยวกับเนื้อหาที่มีอยู่แล้วและสิ่งที่ยังต้องการอยู่

โปรแกรมอื่นที่ออกแบบโดย Allen และทีมของเขาเรียกว่า Plough สามารถเรียนรู้วิธีปฏิบัติงานทั่วไปในคอมพิวเตอร์ "นี่คือระบบที่ช่วยให้คุณสามารถใช้กล่องโต้ตอบเพื่อฝึกระบบของคุณได้ว่าจะทำอะไรให้คุณ" เขากล่าว "

" ตัวอย่างเช่นแอลเลนแสดงให้เห็นว่าโปรแกรมเรียนรู้วิธีค้นหาร้านอาหารใกล้เคียงโดยใช้เบราเซอร์ ผู้ใช้จะเปิดเบราเซอร์ไปที่ไซต์ของร้านอาหารค้นหาประเภทของร้านอาหารที่ขอและสถานที่แล้วตัดและวางผลลัพธ์ลงในหน้าว่าง ผู้ใช้อธิบายแต่ละขั้นตอนขณะดำเนินการ

ในกระบวนการ Plow จะบันทึกแต่ละขั้นตอนและตอบสนองได้ชัดเจนเมื่อเข้าใจขั้นตอน หลังจากนั้นเมื่อผู้ใช้ต้องการค้นหาร้านอาหารอื่นโปรแกรมจะดำเนินการเปลี่ยนแปลงทั้งหมดเช่นเดียวกันโดยสร้างรายชื่อร้านอาหารใหม่โดยอัตโนมัติ สำนักงานโครงการวิจัยขั้นสูงของสหรัฐอเมริกาสนับสนุนการพัฒนาโครงการนี้

ข้อมูลเพิ่มเติมเป็นหัวใจสำคัญสำหรับระบบประมวลผลภาษาที่เหมือนมนุษย์มากขึ้นซึ่งเป็นที่ยอมรับจากนักวิทยาศาสตร์หัวหน้าของ Microsoft ในการพูด Larry Heck ในการพูดคุยในที่ประชุมอีกครั้ง "ถ้าคุณไม่มีข้อมูลมันไม่สำคัญว่าอัลกอริทึมของคุณจะมีความซับซ้อนมากแค่ไหน" เขากล่าว "

สถานที่หนึ่งที่จะหาข้อมูลเพิ่มเติมน่าจะอยู่ในข้อความค้นหาของเครื่องมือค้นหา บริการของเครื่องมือค้นหาได้รับข้อความค้นหาจำนวนมากซึ่งทั้งหมดได้รับการเชื่อมโยงกับคำตอบ "ฉันมองว่าการค้นหาเป็นญาติสนิทกับเทคโนโลยีการประมวลผลภาษา" Heck กล่าว

วันนี้คนเราได้รับการฝึกอบรมเพื่อจัดโครงสร้างคำค้นหาของพวกเขาเป็นชุดคำหลัก แต่ถ้าผู้ใช้พิมพ์ประโยคเต็มรูปแบบเพื่ออธิบายถึงสิ่งที่ต้องการชุดข้อมูลที่ได้จะช่วยให้ระบบเข้าใจได้มากขึ้นว่าผู้คนกำลังมองหาอะไร

Heck คาดการณ์ว่าเมื่อมีผู้ใช้บริการค้นหาที่เปิดใช้งานด้วยเสียงมากขึ้น จาก Microsoft และ Google พวกเขาก็จะคุ้นเคยกับการจัดโครงสร้างแบบสอบถามเป็นประโยคเต็มรูปแบบซึ่งจะสามารถช่วยให้ระบบ NLP สามารถตอบสนองความต้องการของผู้ใช้ได้ดีขึ้น

Joab Jackson ครอบคลุมซอฟต์แวร์องค์กรและข่าวเทคโนโลยีทั่วไปสำหรับข่าว

ข่าว IDG บริการ ติดตาม Joab ทางทวิตเตอร์ที่ @Joab_Jackson ที่อยู่อีเมลของ Joab คือ [email protected]