Windows

ข้อมูลขนาดใหญ่ 3 Vs - แนวคิดและโมเดล

เวก้าผับ ฉบับพิเศษ

เวก้าผับ ฉบับพิเศษ

สารบัญ:

Anonim

คำว่า `ข้อมูล` ไม่ใช่เรื่องใหม่สำหรับเรา เป็นหนึ่งในสิ่งแรกที่สอนเมื่อคุณเลือกใช้เทคโนโลยีสารสนเทศและคอมพิวเตอร์ ถ้าคุณจำได้ข้อมูลถือว่าเป็นรูปแบบข้อมูลดิบ แม้ว่าจะมีมานานนับทศวรรษแล้วก็ตาม แต่คำว่า ข้อมูลขนาดใหญ่ เป็นเรื่องที่น่าสนใจในปัจจุบัน อย่างเห็นได้ชัดจากคำว่าโหลดและโหลดข้อมูลเป็นข้อมูลขนาดใหญ่และสามารถประมวลผลได้หลากหลายวิธีโดยใช้วิธีการและเครื่องมือต่างๆในการจัดหาข้อมูลที่ต้องการ บทความนี้กล่าวถึงแนวคิด Big Data โดยใช้ 3 V ที่ Doug Laney เป็นผู้บุกเบิกด้านคลังข้อมูลซึ่งถือได้ว่าเป็นผู้ริเริ่มด้านเศรษฐศาสตร์สารสนเทศ Infonomics (Information Economics)

ก่อนดำเนินการต่อคุณอาจต้องการอ่านบทความเกี่ยวกับข้อมูลพื้นฐานเกี่ยวกับข้อมูลขนาดใหญ่และการใช้ข้อมูลขนาดใหญ่เพื่อทำความเข้าใจสาระสำคัญ พวกเขาอาจเพิ่มเติมถึงโพสต์นี้สำหรับคำอธิบายเพิ่มเติมเกี่ยวกับแนวคิด Big Data

ข้อมูลขนาดใหญ่ 3 Vs

ข้อมูลในรูปแบบใหญ่ที่สะสมผ่านวิธีการต่างๆถูกเก็บอย่างถูกต้องในฐานข้อมูลที่ต่างกันก่อนหน้านี้และถูกทิ้งหลังจากบางเวลา เมื่อแนวคิดปรากฏว่ายิ่งมีข้อมูลมากเท่าใดก็ยิ่งหาได้ง่ายขึ้นข้อมูลที่แตกต่างและมีความเกี่ยวข้องโดยใช้เครื่องมือที่เหมาะสม บริษัท ต่างๆก็เริ่มเก็บข้อมูลเป็นระยะเวลานาน นี่เป็นเหมือนการเพิ่มอุปกรณ์จัดเก็บข้อมูลใหม่หรือใช้ระบบคลาวด์เพื่อจัดเก็บข้อมูลในรูปแบบใดก็ตามที่มีการจัดเก็บข้อมูลเอกสารเอกสารสเปรดชีตฐานข้อมูลและ HTML เป็นต้นจากนั้นจะจัดรูปแบบที่เหมาะสมโดยใช้เครื่องมือที่สามารถประมวลผลชิ้นงานขนาดใหญ่ได้ ข้อมูล

หมายเหตุ: ขอบเขตของข้อมูลขนาดใหญ่ไม่ จำกัด เฉพาะข้อมูลที่คุณเก็บรวบรวมและเก็บไว้ในสถานที่และระบบคลาวด์ของคุณ อาจรวมถึงข้อมูลจากแหล่งข้อมูลอื่นรวมถึง แต่ไม่ จำกัด เพียงรายการในโดเมนสาธารณะ

โมเดล 3 มิติของข้อมูลขนาดใหญ่ขึ้นอยู่กับ V ต่อไปนี้:

  1. Volume: หมายถึงการจัดการการจัดเก็บข้อมูล
  2. ความเร็ว: หมายถึงความเร็วของการประมวลผลข้อมูล
  3. ความหลากหลาย: หมายถึงการจัดกลุ่มข้อมูลของชุดข้อมูลที่แตกต่างกันดูเหมือนจะไม่เกี่ยวข้อง

ย่อหน้าต่อไปนี้อธิบายการสร้างโมเดล Big Data โดยพูดถึงแต่ละมิติ (แต่ละ V) ในรายละเอียด

A] ปริมาณข้อมูลขนาดใหญ่

การพูดคุยเกี่ยวกับ Big Data หนึ่งอาจเข้าใจปริมาณเป็นชุดใหญ่ของข้อมูลดิบ แม้ว่าจะเป็นความจริง แต่ก็เป็นเรื่องเกี่ยวกับค่าใช้จ่ายในการจัดเก็บข้อมูล ข้อมูลที่สำคัญสามารถเก็บไว้ในสถานที่และบนระบบคลาวด์ซึ่งเป็นทางเลือกที่ยืดหยุ่น แต่คุณต้องจัดเก็บข้อมูลแต่ละอย่างไว้หรือไม่?

ตามเอกสารเผยแพร่ของ Meta Group เมื่อปริมาณข้อมูลเพิ่มขึ้นส่วนต่างๆของข้อมูลเริ่มมองไม่จำเป็น นอกจากนี้ยังระบุว่ามีเพียงปริมาณข้อมูลที่ควรเก็บไว้ซึ่งธุรกิจต้องการใช้ ข้อมูลอื่น ๆ อาจถูกละทิ้งหรือหากธุรกิจลังเลที่จะปล่อยข้อมูลที่ไม่สำคัญที่คาดว่าจะเป็นข้อมูลทิ้งไปอาจถูกทิ้งบนอุปกรณ์คอมพิวเตอร์ที่ไม่ได้ใช้และแม้แต่เทปเพื่อไม่ให้ธุรกิจต้องเสียค่าใช้จ่ายในการจัดเก็บข้อมูลดังกล่าว

ฉันใช้ "ข้อมูลที่ไม่สำคัญตามที่คาดคะเน" เนื่องจากฉันก็เชื่อว่าข้อมูลใด ๆ ที่จำเป็นสำหรับธุรกิจในอนาคตไม่ช้าก็เร็วและต้องการเก็บข้อมูลไว้เป็นระยะเวลานานก่อนที่คุณจะทราบว่าข้อมูลนั้น ไม่สำคัญ ส่วนตัวผมทิ้งข้อมูลเก่าลงในฮาร์ดดิสก์จากปีกลายและบางครั้งในดีวีดี คอมพิวเตอร์หลักและระบบจัดเก็บข้อมูลในระบบคลาวด์มีข้อมูลที่ฉันคิดว่าสำคัญและรู้ดีว่าฉันจะใช้ ข้อมูลเหล่านี้มีข้อมูลการใช้งานเพียงครั้งเดียวซึ่งอาจสิ้นสุดในฮาร์ดดิสก์เก่าหลังจากไม่กี่ปี ตัวอย่างข้างต้นเป็นเพียงเพื่อความเข้าใจของคุณ มันจะไม่พอดีกับคำอธิบายของข้อมูลขนาดใหญ่เนื่องจากจำนวนเงินนั้นน้อยกว่าที่ บริษัท เห็นว่าเป็นข้อมูลขนาดใหญ่

B ] ความเร็วในข้อมูลขนาดใหญ่

ความเร็วในการประมวลผลข้อมูลเป็นปัจจัยสำคัญ เมื่อพูดถึงแนวคิดเรื่อง Big Data มีเว็บไซต์จำนวนมากโดยเฉพาะ e-commerce Google ยอมรับแล้วว่าความเร็วที่โหลดเป็นสิ่งสำคัญสำหรับการจัดอันดับที่ดีขึ้น นอกเหนือจากการจัดอันดับแล้วความเร็วยังมอบความสะดวกสบายแก่ผู้ใช้ขณะที่พวกเขาซื้อสินค้า เช่นเดียวกับข้อมูลที่ประมวลผลสำหรับข้อมูลอื่น ๆ

ในขณะที่พูดถึงความเร็วก็เป็นสิ่งสำคัญที่จะรู้ว่ามันอยู่นอกเหนือแบนด์วิธที่สูงขึ้นเพียง มันรวมข้อมูลที่ใช้งานได้ง่ายด้วยเครื่องมือการวิเคราะห์ที่แตกต่างกัน ข้อมูลที่ใช้งานได้ง่ายหมายถึงการบ้านบางส่วนเพื่อสร้างโครงสร้างข้อมูลที่ง่ายต่อการประมวลผล มิติต่อไป - ความหลากหลายกระจายความสว่างในเรื่องนี้

C] ความหลากหลายของข้อมูลขนาดใหญ่

เมื่อมีโหลดและโหลดข้อมูลจำนวนมากจะกลายเป็นเรื่องสำคัญในการจัดระเบียบข้อมูลเหล่านี้ในแบบที่เครื่องมือวิเคราะห์สามารถประมวลผลได้อย่างง่ายดาย ข้อมูล. มีเครื่องมือสำหรับจัดการข้อมูลด้วย เมื่อจัดเก็บข้อมูลจะไม่มีโครงสร้างและมีรูปแบบใดก็ได้ ขึ้นอยู่กับคุณที่จะคิดออกว่ามันมีความสัมพันธ์กับข้อมูลอื่น ๆ กับคุณ คุณสามารถเลือกเครื่องมือที่เหมาะสมและแปลงข้อมูลเป็นรูปแบบที่ต้องการสำหรับการเก็บข้อมูลที่มีโครงสร้างและเรียงลำดับ

สรุป

กล่าวได้อีกนัยหนึ่งว่า 3D Model ของ Big Data ใช้ข้อมูลสามมิติข้อมูล USABLE ที่คุณมี; การติดแท็กข้อมูลที่เหมาะสม และประมวลผลได้เร็วขึ้น ข้อมูลเหล่านี้จะถูกประมวลผลหรือวิเคราะห์เพื่อหาสิ่งที่คุณต้องการ

ด้านบนจะอธิบายทั้งแนวคิดและแบบจำลอง 3 มิติของ Big Data บทความที่เชื่อมโยงในหัวข้อที่สองจะเป็นการสนับสนุนเพิ่มเติมหากคุณยังไม่คุ้นเคยกับแนวคิด

ถ้าคุณต้องการเพิ่มอะไรกรุณาแสดงความคิดเห็น