Windows

ผู้ใช้แพลตฟอร์มการประมวลผลข้อมูล Hadoop มีเครื่องมืออีกสองอย่างเพื่อช่วยในการจัดเรียงข้อมูลภูเขา

Faith Evans feat. Stevie J – "A Minute" [Official Music Video]

Faith Evans feat. Stevie J – "A Minute" [Official Music Video]
Anonim

ผู้จัดจำหน่าย MapR ได้รวม LucidWorks Search ไว้ในการจัดจำหน่ายของตัวเอง ในขณะเดียวกัน Cloudera ได้เปิดตัวเครื่องมือค้นหาแบบโอเพนซอร์ส SQL สำหรับ Hadoop อย่างเต็มรูปแบบเป็นครั้งแรก

"การใช้การค้นหาเป็นส่วนติดต่อผู้ใช้สำหรับข้อมูลขนาดใหญ่เป็นเรื่องที่น่าสนใจมาก. การค้นหาเหมาะสมกับการใช้ประโยชน์ข้อมูลจำนวนมากโดยเฉพาะข้อมูลที่ไม่มีโครงสร้าง "นายแจ็คนอร์ริสหัวหน้าฝ่ายการตลาดของ MapR กล่าว "เรากำลังเห็นแอพพลิเคชันที่น่าสนใจบางอย่างกับเครื่องมือค้นหาที่หลักแม้ว่าผู้ใช้ทั่วไปจะไม่คิดว่าพวกเขาเป็นเครื่องมือค้นหาก็ตาม" LucidWorks Search เป็นรุ่นพาณิชย์ของ Apache Lucene / Solr - เครื่องมือค้นหาข้อความ ด้วยการผสานรวม MapR ใหม่ LucidWorks Search สามารถค้นหาข้อมูลได้จาก Hadoop File Systems (HDFS) หรือไฟล์ต่างๆในระบบไฟล์อื่น ๆ

LucidWorks Search มีภาพรวมและภาพสะท้อนเพื่อความพร้อมใช้งานสูงและช่วยลดงานที่ต้องใช้ ติดตั้ง Lucene / Solr จากรอยขีดข่วน นอกจากนี้ยังมีการสนับสนุนแหล่งข้อมูลเพิ่มเติมจากแหล่งข้อมูลกราฟิกอินเทอร์เฟซผู้ใช้แบบกราฟิกและกรอบความปลอดภัย

เครื่องมือค้นหาสามารถใช้ในแอ็พพลิเคชันเว็บแบบไดนามิกเพื่อเรียกค้นรูปภาพโฆษณาข้อแนะนำผลิตภัณฑ์และข้อมูลอื่น ๆ ที่สามารถใช้งานได้อย่างรวดเร็ว ติดตั้งเว็บไซต์ได้ทันที "นี้ไม่ได้เป็นต้นทุนที่ต่ำกว่าแทนคลังข้อมูล นี่คือการใช้ประโยชน์จากแหล่งข้อมูลใหม่ ๆ และทำบางอย่างที่ส่งผลกระทบต่อธุรกิจอย่างมาก "Norris กล่าว MapR และ LucidWorks ได้ร่วมมือกันจับคู่เทคโนโลยีของพวกเขาตั้งแต่ปี 2011 เมื่อพวกเขาได้ตกลงร่วมกันด้านการตลาด เมื่อต้นปีนี้พวกเขาได้ปล่อยตัวเชื่อมต่อที่ทำให้ใช้งาน Lucene / Solr กับการกระจาย MapR Hadoop ได้อย่างรวดเร็ว

LucidWords Search ทำงานร่วมกับการแจกจ่าย M7 ที่เผยแพร่ใหม่ของ MapR ในรูปแบบเบต้า นอกจากการสนับสนุน LucidWorks Search แล้วรุ่น M7 ยังได้รับการออกแบบมาใหม่เพื่อลดการทำงานของคอมโพสิตหรือการตรวจสอบความสอดคล้องพื้นหลังด้วยประสิทธิภาพที่รวดเร็ว

นอกจากนี้ในสัปดาห์นี้ Cloudera ได้เปิดตัว Cloudera Impala เวอร์ชัน 1.0 ซึ่งเป็นเครื่องมือค้นหาที่สามารถทำงานร่วมกับ SQL แบบโอเพ่นซอร์สได้ Hadoop SQL เป็นภาษาอินเทอร์เฟซฐานข้อมูลที่ใช้ในระบบจัดการฐานข้อมูลเชิงสัมพันธ์ (RDMS) และเป็นที่รู้จักโดยผู้ดูแลระบบฐานข้อมูล

Impala ถูกออกแบบมาให้รันคำสั่งได้เร็วกว่า Hiveop's Hive เนื่องจากไม่ใช้กรอบ MapReduce ซึ่งต้องใช้ ผลการค้นหาที่จะเขียนลงในดิสก์ แต่ผู้ใช้สามารถสืบค้นข้อมูลที่เก็บไว้ใน HDFS และ HBase ได้โดยตรง ผู้ใช้สามารถสืบค้นข้อมูลได้ทั้งแบบโต้ตอบหรือแบบแบทช์

Cloudera ได้เปิดตัวเวอร์ชันนี้เมื่อเดือนตุลาคมที่ผ่านมาเป็นเวอร์ชันเบต้า ตั้งแต่นั้นมาซอฟต์แวร์ได้รับการทดสอบโดย บริษัท เช่น 37signals และ Expedia

Impala เป็นองค์ประกอบหลักของแพคเกจเสริม Cloudera Enterprise RTQ (Real-Time Query) สำหรับแพลตฟอร์ม Cloudera Hadoop Impala สามารถดาวน์โหลดได้ฟรีไม่มีค่าใช้จ่าย

อัปเดตวันที่ 6 พฤษภาคมเพื่อแก้ไขข้อมูลเกี่ยวกับเทคโนโลยี Cloudera Impala