เว็บไซต์

Nvidia เปิดตัวสถาปัตยกรรม Fermi Next-Gen

พิศาล เชิงหà¸à¸¡

พิศาล เชิงหà¸à¸¡
Anonim

Nvidia อาจเปลี่ยนชื่อเป็น NVISION promotion "GPU Technology Conference" แต่ก็ยังเป็นการแสดง Nvidia ผ่านและผ่าน ซีอีโอของ Jen-Hsun Huang ได้ใช้เวลาในการกล่าวสุนทรพจน์ของเขาในการเปิดตัวสถาปัตยกรรม GPU ที่สำคัญของ บริษัท ซึ่งมีชื่อว่า "Fermi" นี่คือแฟน ๆ ของกราฟิกชิพเรียกชื่อ GT300 ซึ่งเป็นรุ่นต่อ ๆ ไปของชิป GT200 ที่ใช้พลังการ์ดเช่น GeForce GTX 285

ยักษ์ใหญ่ของชิพได้ระมัดระวังในการจัดตำแหน่งชิปไม่ใช่ชิปกราฟิกใหม่ แต่เป็นรุ่นใหม่ " คำนวณ และกราฟิก" ชิปตามลำดับ (ตัวเอียง) ในความเป็นจริงเกือบทุกอย่างที่เปิดเผยเกี่ยวกับชิปตัวใหม่เกี่ยวข้องกับคุณลักษณะด้านการคำนวณแทนที่จะเป็นสิ่งที่เน้นกราฟิกแบบเดิมเช่นหน่วยพื้นผิวและสิ้นสุดการแสดงผล สิ่งที่เรารู้ก็คือชิปมีขนาดใหญ่ที่ประมาณ 3.0 พันล้านทรานซิสเตอร์และจะผลิตในกระบวนการ 40nm ที่ TSMC นี่เป็นทรานซิสเตอร์ประมาณ 40 เปอร์เซ็นต์มากกว่าชิพ RV870 ในการ์ด Radeon 5800 ซีรีส์ DirectX 11 ซึ่งเพิ่งวางจำหน่ายโดยคู่แข่งของเอเอ็มดี ชิปมีหน่วยประมวลผล 512 เครื่อง (Nvidia เรียกว่าแกน CUDA) จัดเป็นตัวประมวลผลแบบสตรีมมิ่งขนาด 16 "จำนวน 32 คอร์แต่ละตัว นี่คือมากกว่า 240 คูลใน GT200 และแกนมีการปรับปรุงที่สำคัญนอกเหนือจากนี้ ชิพจะใช้อินเตอร์เฟซหน่วยความจำ GDDR5 ขนาด 384 บิต

ต่อไปนี้คือจุดสำคัญ ๆ:

Multiprocessor สตรีมมิ่งรุ่นที่สาม (SM)

  • 32 แกน CUDA ต่อ SM 4x เหนือ GT200
  • 8x ประสิทธิภาพการทำงานของจุดลอยตัวที่มีความแม่นยำสูงกว่า GT200
  • Dual Warp Scheduler ที่กำหนดตารางเวลาและส่งข้อมูลสองสายสะพายจาก 32 เธรด
  • ต่อนาฬิกา
  • 64 กิโลไบต์ของแรมด้วยการแบ่งพาร์ทิชันที่แบ่งใช้หน่วยความจำร่วมกันและแคช L1

การสร้างโพรเซสเซอร์ Parallel Thread ISA

  • ที่อยู่ Unified Space รองรับ C + +
  • เหมาะสำหรับ OpenCL และ DirectCompute
  • Full IEEE 754-2008 ความละเอียด 32 บิตและ 64 บิตเต็มรูปแบบ
  • เส้นทางจำนวนเต็มที่ 32 บิตพร้อมด้วย 64
  • หน่วยความจำที่ปรับปรุงใหม่
  • ลำดับชั้นของ NVIDIA Parallel Data Cache กับแคช L2 และ L2 ที่กำหนดค่าได้

แคช

  • คำแนะนำในการเข้าถึงหน่วยความจำเพื่อสนับสนุนการเปลี่ยนไปใช้ที่อยู่แบบ 64- GPU ตัวแรกที่รองรับหน่วยความจำ ECC
  • การทำงานของหน่วยความจำอะตอมที่ดียิ่งขึ้น ประสิทธิภาพการทำงาน
  • NVIDIA GigaThread Engine

การสลับบริบทของแอพพลิเคชันได้เร็วขึ้น 10 เท่า

  • การประมวลผลเคอร์เนลที่เกิดขึ้นพร้อมกัน
  • การดำเนินการตามลำดับด้ายสั่งปิด
  • เครื่องมือถ่ายโอนหน่วยความจำแบบทับซ้อนกันแบบคู่
  • สมรรถนะของชิปตัวนี้ในงานคอมพิวเตอร์แบบสตรีมเช่นอัตราการคำนวณจุดลอยตัวแบบ double-precision ที่เร็วกว่ามาก ปัจจุบัน GPU ของ Nvidia คำนวณความแม่นยำสองเท่าที่ความเร็วเพียงเล็กน้อยสำหรับการดำเนินงานที่มีความแม่นยำเพียงอย่างเดียว การดำเนินงานแบบจุดลอยตัวแบบ double-precision ควรมีประสิทธิภาพเพียงครึ่งเดียวที่มีความแม่นยำเพียงจุดเดียวซึ่งเป็นผลดีอย่างมาก การปรับปรุงแคชและการตั้งเวลาที่ดีขึ้นเป็นอย่างมากเช่นกัน คุณสามารถอ่านเพิ่มเติมเกี่ยวกับสถาปัตยกรรมได้ที่หน้า Fermi ของ Nvidia ใหม่ซึ่งรวมถึงเอกสาร PDF PDF

คุณจะสามารถซื้อการ์ดจอที่ใช้ชิปนี้ได้เมื่อใด? Nvidia ไม่ได้พูด ตัวแทนของ บริษัท กล่าวว่าปัจจุบันพวกเขากำลัง "นำชิพ" ขึ้นมาซึ่งหมายความว่าตัวอย่างการทำงานเพิ่งกลับมาจากโรงงานผลิต การคาดเดาเกี่ยวกับการศึกษาจากประวัติศาสตร์ที่ผ่านมาเราจะบอกว่า December เป็นวันที่เผยแพร่ในแง่ดีและ Q1 2010 สำหรับความพร้อมใช้งานทั่วโลกมีโอกาสมากขึ้น คาดว่าบอร์ดจะมีราคาแพง Nvidia จะไม่เปิดเผยขนาดของชิป แต่ตัดสินโดยการนับทรานซิสเตอร์ที่เราคาดไว้ระหว่าง 450 ถึง 500 mm

2 ควบคู่ไปกับการเพิ่มค่าใช้จ่ายของบอร์ดในส่วนติดต่อหน่วยความจำ 384 บิตและความท้าทายในการสร้างผลตอบแทนที่ดีให้กับชิปขนาดใหญ่ในกระบวนการผลิต 40nm ที่ค่อนข้างใหม่และคุณกำลังมองหาการ์ดที่น่าจะมีประสิทธิภาพมากขึ้นและ มีราคาแพงกว่าการ์ด Radeon 5800 series ที่เพิ่งเปิดตัวของ AMD ตาม Jason Cross ที่ Twitter หรือเยี่ยมชมบล็อกของเขา