Car-tech

Google: มีการเผยแพร่หนังสือกว่า 129 ล้านเล่ม

เวก้าผับ ฉบับพิเศษ

เวก้าผับ ฉบับพิเศษ
Anonim

สำหรับผู้ที่สงสัยว่ามีหนังสืออยู่ในโลกจำนวนเท่าใด Google มีคำตอบสำหรับคุณ: 129,864,880 อ้างอิงจาก Leonid Taycher วิศวกรซอฟต์แวร์ของ Google ที่ทำงานในโครงการ Google หนังสือ

การประมาณจำนวน ของหนังสือทั่วโลกเป็นมากกว่าการออกกำลังกายในความอยากรู้สำหรับยักษ์ค้นหา: นอกจากนี้ยังมีแผนงานบางส่วนของงานที่ยังเหลือที่จะทำในการบรรลุเป้าหมายของ บริษัท ที่มีความทะเยอทะยานในการจัดระเบียบข้อมูลทั้งหมดของโลก

"เมื่อ คุณเป็นส่วนหนึ่งของ บริษัท ที่กำลังพยายามทำหนังสือดิจิทัลทั้งหมดในโลกคำถามแรกที่คุณมักจะได้รับคือ "กี่เล่มที่จะออกไปที่นั่น" Taycher อธิบายในโพสต์บล็อกที่ประกาศค่าประมาณ

[อ่านเพิ่มเติม: บริการสตรีมมิ่งทีวีที่ดีที่สุด]

เพื่อให้ได้ข้อมูลใกล้เคียงที่เหมาะสม บริษัท เริ่มต้นด้วยการรวบรวมข้อมูลหนังสือจากระบบการจัดรายการแบบต่างๆเช่น International Standard Book Numbers (ISBN)

แคตตาล็อกดังกล่าวในขณะที่เป็นประโยชน์ไม่ได้ให้การนับที่ชัดเจน อย่างไรก็ตาม ยกตัวอย่างเช่น ISBN ได้รับมอบหมายให้ทำหนังสือตั้งแต่ทศวรรษที่ 1960 เท่านั้นและมีแนวโน้มที่จะใช้เฉพาะในประเทศตะวันตกเท่านั้น

มีการมอบหมายหนังสือหลายเล่มให้กับเลข ISBN แต่ละรายและผู้จัดพิมพ์ได้มอบหมาย ISBN ให้กับรายการอื่น ๆ นอกเหนือจากหนังสือเช่นหนังสือ, เช่นวิศวกรฝ่ายขายของ Google ได้เขียนโปรแกรมเพื่อดัดแปลงแคตตาล็อกและไดเรกทอรีดังกล่าวประมาณ 150 รายการและกำจัดรายการที่ซ้ำกันมากที่สุดเท่าที่จะทำได้

บริษัท ยังต้องทำเป็นจำนวนมาก การตัดสินใจที่ยากลำบากเกี่ยวกับสิ่งที่เป็นและไม่ใช่หนังสือ Taycher อธิบาย

ตัวอย่างเช่นปกอ่อนและปกปกแข็งของข้อความจะถูกนับเป็นหนังสือสองเล่มเช่นเดียวกับในรูปแบบต่างๆของข้อความที่เป็นที่นิยมเช่นเชคสเปียร์ "Hamlet" เนื่องจากคำนำและข้อคิดเห็นที่พวกเขาอาจมี Serials สามารถนับเป็นหนังสือแต่ละเล่มหรือเป็นงานที่เก็บรวบรวมได้

ณ เดือนมิถุนายน บริษัท ได้สแกนหนังสือจำนวน 12 ล้านเล่มตามการนำเสนอของผู้จัดการฝ่ายวิศวกรรม Google Books Jon Orwant ในที่ประชุมวิชาการประจำปี USENIX ในบอสตัน หนังสือเหล่านี้เขียนขึ้นในประมาณ 480 ภาษา (รวมถึงหนังสือ 3 เล่มในภาษาคลิงออนที่มีชื่อว่า Star Trek)

บริษัท วางแผนจะทำการสแกนหนังสือที่มีอยู่ภายในหนึ่งทศวรรษ Orwant กล่าวว่าประมาณ 20 เปอร์เซ็นต์ของหนังสือทั่วโลกอยู่ในโดเมนสาธารณะ Orwant อธิบาย ประมาณ 10 ถึง 15 เปอร์เซ็นต์ของหนังสือเหล่านี้พิมพ์อยู่ หนังสือที่เหลืออยู่ - ส่วนใหญ่ของชื่อทั้งหมด - ยังคงอยู่ภายใต้ลิขสิทธิ์ แต่พิมพ์ออกมา Google อยู่ในระหว่างการยืมสำเนาหนังสือเหล่านี้เพื่อให้เป็นดิจิทัลจากห้องสมุดขนาดใหญ่ประมาณ 40 แห่งทั่วโลก

การกระทำนี้เป็นการสแกนหนังสือที่ไม่มีการพิมพ์ แต่ยังคงครอบคลุมโดยลิขสิทธิ์ที่ได้รับ มีความต้านทานต่ออุตสาหกรรมสำนักพิมพ์บางอย่าง

ขณะนี้ บริษัท กำลังรอคำตัดสินจากศาลแขวงสหรัฐในเขตภาคใต้ของนิวยอร์กว่าสามารถสแกนหนังสือเหล่านี้ได้หรือไม่

ในปีพศ. 2548 สมาคม Authors Guild และ สมาคมสำนักพิมพ์อเมริกันได้ยื่นฟ้องคดีต่อยักษ์การค้นหาซึ่งอ้างว่า บริษัท ละเมิดลิขสิทธิ์ผู้เขียนด้วยการสแกนหนังสือดังกล่าว

Google อ้างว่าต้องการขายสำเนาดิจิทัลของ บริษัท เหล่านี้ พิมพ์หนังสือและตั้งค่าลิขสิทธิ์สำหรับผู้เขียนเพื่อเรียกร้อง นอกจากนี้ บริษัท ยังหวังที่จะเปิดเผยตัวอย่างหนังสือเหล่านี้ในการค้นเว็บและอ้างว่าการใช้งานนี้อยู่ภายใต้หลักเกณฑ์ด้านการใช้งานที่เหมาะสมของสหรัฐอเมริกา

การสแกนหนังสือทั่วโลกจะนำไปสู่ประโยชน์อื่น ๆ นอกเหนือจากการปรับปรุงการค้นหา เมื่อไดรฟ์ข้อมูลทั้งหมดเหล่านี้ได้รับการแปลงเป็นข้อมูลดิจิทัลเนื้อหาของพวกเขาอาจถูกนำมาวิเคราะห์ซึ่งอาจนำไปสู่ข้อมูลเชิงลึกใหม่ นักภาษาศาสตร์สามารถค้นพบเมื่อคำบางคำมาสู่การใช้งานอย่างแพร่หลายหรือผู้ที่เริ่มใช้คำเหล่านี้เป็นครั้งแรก

Google Book Search สามารถช่วยตอบคำถามทางประวัติศาสตร์ที่โดดเด่นบางเรื่องได้เช่นการที่ Isaac Newton และ Gottfried Leibniz สามารถคิดค้นแคลคูลัสได้หรือไม่?

"เราสามารถค้นหาได้ไม่เพียง วลี แต่สำหรับแนวคิด "Orwant อธิบาย "เราสามารถใช้วิธีต่าง ๆ ทั้งหมดที่ว่าจะสามารถผสานความคิดของอินฟินิตี้แปลเป็นภาษาต่าง ๆ และค้นหาแบบขนาน"

"ความหวังของผมคือเมื่อเราเริ่มแสดงออกมากขึ้น คอลเลกชันนี้จะช่วยให้ผู้คนสามารถถามคำถามแบบนี้ได้ว่าพวกเขาไม่สามารถถามได้ก่อน "เขากล่าว"

บรรณาธิการของ IDG News Service Juan Carlos Perez มีส่วนร่วมในรายงานฉบับนี้

Joab Jackson ครอบคลุมซอฟต์แวร์ขององค์กร ข่าวเทคโนโลยีทั่วไปสำหรับ

ข่าวบริการ IDG

ติดตาม Joab ทางทวิตเตอร์ที่ @Joab_Jackson ที่อยู่อีเมลของ Joab คือ [email protected]