Android

Google: เราได้สร้างความก้าวหน้าในการค้นหารูปภาพ

เวก้าผับ ฉบับพิเศษ

เวก้าผับ ฉบับพิเศษ
Anonim

มนุษย์อาจเก่งในการจดจำรูปแบบ แต่คอมพิวเตอร์ไม่ฉลาดในการระบุภาพ สมองของเราสามารถระบุภาพสถานที่สำคัญที่มีชื่อเสียงเช่น Statue of Liberty หรือกำแพงเมืองจีนได้โดยทันที แต่คอมพิวเตอร์โดยทั่วไปไม่มีแท็กข้อความเป็นแผ่นโกง

อาจมีการเปลี่ยนแปลงได้หากโครงการวิจัยของ Google "คอมพิวเตอร์วิสัยทัศน์" pans out ยักษ์ค้นหาได้นำเสนอบทความเกี่ยวกับการรับรู้สถานที่สำคัญในงาน Computer Vision and Pattern Recognition (CVPR) ในไมอามี เทคโนโลยีใหม่นี้ช่วยให้คอมพิวเตอร์สามารถทำ I.D ได้อย่างรวดเร็ว ภาพของสถานที่สำคัญระดับโลกกว่า 50,000 แห่งที่มีความถูกต้อง 80 เปอร์เซ็นต์ Google กล่าวว่า

Google กำลังชี้ให้เห็นอย่างรวดเร็วว่าเทคโนโลยีการจดจำรูปแบบยังคงเป็นโครงการวิจัยและไม่ใช่บริการใหม่ นั่นเป็นเหตุผลที่เครื่องมือค้นหาที่ถูกต้องเพียง 8 ใน 10 ข้อพยายามยังไม่พร้อมสำหรับเวลาสำคัญ ยังคงแนวคิดเป็นเย็นสวยและสามารถพิสูจน์ประโยชน์ให้กับนักท่องเที่ยวหาก Google สามารถเพิ่มอัตราความถูกต้องสักวันหนึ่ง ความสามารถในการถ่ายภาพสถานที่สำคัญที่ไม่ได้ระบุและมีสมาร์ทโฟนหรือกล้องที่สามารถใช้งาน Net ได้ระบุว่าทันทีที่ได้รับความนิยมผมคิดว่า แน่นอนว่ายังมีศักยภาพสำหรับการใช้งานทางวิทยาศาสตร์และผู้บริโภคที่ยังไม่มีใครคิดอีกต่อไป

ดังนั้นมันจึงเป็นอย่างไร? Jay Yagnik หัวหน้าฝ่ายวิจัยวิสัยทัศน์ด้านคอมพิวเตอร์ของ Google กล่าวในบล็อกโพสต์ ขั้นตอนแรกคือการใช้รูปภาพที่ติดแท็กด้วย GPS จำนวน 40 ล้านรูปจากบริการ Google Picasa และ Panoramio สองรายการรวมถึงหน้าเว็บคู่มือการท่องเที่ยวออนไลน์เพื่อรวบรวมรายชื่อสถานที่ "ถัดไปเราพบภาพของผู้สมัครสำหรับแต่ละจุดสังเกตการณ์โดยใช้แหล่งข้อมูลเหล่านี้และ Google Image Search ซึ่งเราจะ" ตัดแต่ง "โดยใช้การจับคู่ภาพที่มีประสิทธิภาพและเทคนิคการจัดกลุ่มที่ไม่ได้เก็บข้อมูลไว้" ขั้นตอนสุดท้ายคือการพัฒนาระบบจัดทำดัชนีสำหรับ จดจำภาพได้อย่างรวดเร็ว แต่แม้จะมีความชาญฉลาดของโครงการการค้นหาภาพที่แม่นยำยังคงเป็นเรื่องยุ่งยาก ดังรูปด้านล่างแสดงว่าสถานที่สำคัญที่ไม่เกี่ยวข้องอาจมีลักษณะทางสถาปัตยกรรมที่คล้ายกัน นอกจากนี้การรวมแบนเนอร์หรือธงขนาดใหญ่อาจทำให้เกิดการแข่งขันที่ผิดพลาดได้

หวังว่าโครงการวิจัยของ Google จะปรับปรุงการค้นหารูปภาพซึ่งปัจจุบันพึ่งพาการติดแท็กมากเกินไป ขั้นตอนต่อไปก็คือการหาวิธีที่จะระบุจำนวนภาพที่ไม่ได้เป็นที่นับไม่ถ้วน แต่งานนั้นดูเหมือนจะท้าทายมากขึ้นเรื่อย ๆ